紙とエンピツ_ブログ版
id:y_koutarou
かなの出現数・連なり数データ(n-gram)
新下駄配列を作る時に作った、「100万字日本語かなn-gramデータ」を加工して表にしたものを置いておきます*1。今となってはGoogleスプレッドシートというものがあるんだから、表計算ファイルで置いておくよりもこの方が見やすいよな、と思いついたので。 かな1文字の出現数 かな2文字連なりの出現数 かな2文字連なりの出現…