文書を俯瞰 #2

自然言語処理。さてと、特許の分類に興味があったけれども、日本の特許庁は不便なんで、手に入るもので挑戦しようと調査中。 今回は、形態素解析。日本語を分解して単語に分ける。単語を単位とすれば処理ができるようになる。よく見かけるのはMeCabやJanomeという形態素解析ライブラリ。巨大辞書Neologdが使えるMeCabは魅…