太陽がまぶしかったから
id:bulldra
Python と MeCab でオライリー出版の EPUB 電子書籍を日本語形態素解析する
O'Reilly の電子書籍をテキストマイニング 上記の環境を整えたかった理由のひとつとして電子書籍のテキストマイニングがある。 Amazon Kindle や 楽天 Kobo などの電子書籍データは暗号化されているため正当な方法で抽出することができないが、オライリー出版の電子書籍は DRM フリーの EPUB 形式で配信されている。 EPUB…