地平線まで行ってくる。
id:bwgift
Tokenizerを見直してmodernBERTでNERをColabでためしてみる。
KoichiYasuokaさんからHatena Blogにコメントを頂きました。tokenizerに工夫をしては?というものでした。「日本の首相」が「日本の 首相」に分かち書きされています。これでは「日本」を取り出せない。つまり、 今まで:日本の 首相 改善 :日本 の 首相 としたい。納得です。Yasuokaさん、ありがとうございます。 サンプ…