【初心者向け】文章の類似度をTF-IDFで数値化する - Qiita

0.要するに 1.文章の類似度を手軽に数値化するには、TF-IDFが良い。 2.文章に現れる単語の頻度(TF)と希少性(IDF)を掛け合わせて類似度を求める。 3.簡便性に重きを置くなら、形態素解析にはMecabよりjanome、類似度判定にはdoc2vecよりTF-ID...