【python】sklearnのfetch_20newsgroupsで文書分類を試す(2) - 静かなる名辞
前回の続きをやっていく。とりあえず今回は簡単な方法で分類してみて、ベースラインを作ることにする。 目次 特徴を捨てる 分類する まとめ 次回 何はともあれ、文書から特徴抽出してベクトル化しないと話にならない。ベースラインなのでBag of Wordsを使うことにする。pure pythonで愚直に書くと激遅なのが目に見えてるの…