LSIやLDAを手軽に試せるGensimを使った自然言語処理入門

Gensimはベクトル空間モデルを扱うためのPythonモジュールです。ベクトル空間モデルは画像や音声などのメディアにも用いることができますが、Gensimは特に文書を扱うのに便利な機能を多数用意しており、文書集合から簡単に単語文書行列(GensimではCorpusと呼ばれる)を作ることができます。さらに、LSIやLD…