【python】sklearnのfetch_20newsgroupsで文書分類を試す(3) - 静かなる名辞

前回はとりあえずベースラインの分類を行い、F1値にして0.7くらいの性能を得た。 ここで自然言語処理的なアプローチで手法の改良に進むのもありだと思うが、とりあえずmin_dfをパラメタチューニングしてみるか、という方向に傾いている。前回は恣意的に決めたので、色々調整する余地はあると思う。max_dfは前回の結果で影…