【python】nltkで英語のStemmingとLemmatization - 静かなる名辞

Stemming(ステミング)は単語の語幹を取り出したいとき、Lemmatization(レンマ化、敢えてカタカナ表記するとレンマタイゼーション)はカテゴリごとにグルーピングしたりしたいときに使う。 公式ドキュメントはここ。 nltk.stem package — NLTK 3.4 documentation 目次 Stemming 概要 Porterを使う Lancasterを使ってみる…