テキストマイニングへの道05――トピックモデルとの格闘3

hunihunisaito.hatenablog.com 前回の続き。可視化と単語リストとそれぞれの割り当てを出すためのスクリプトをそれぞれ一般化して保存しておく。 可視化 #pandasはデータフレーム操作、MeCabは日本語形態素解析ライブラリ、reは正規表現ライブラリ、CountVectorizerは文書の単語の出現頻度をカウントするためのツール、gen…