薬剤師のプログラミング学習日記
id:enokisaute
Wikipediaの特定カテゴリの記事のみを取得する
自然言語処理に関する機械学習の手法を試す際には大量のテキストデータが必要になることがあります。そこで、手軽に使えるテキストデータとしてWikipediaの記事データを使うことにしたのですが、全データを対象にしてアルゴリズムを学習させるのは時間がかかり過ぎますし、特定のカテゴリ(分野)に特化して学習したモデル…