Pythonで青空文庫データを自然言語処理向けにさくっと一括テキスト整形+前処理 - Qiita

はじめに青空文庫は言わずと知れた、著作権切れの文学作品を有志でデジタル化し公開しているウェブサイトです。現在は青空文庫のデータを利用する技術者のために、全データのテキスト形式やHTML形式が青空文…