SB Intuitions TECH BLOG
id:hppint
日本語ModernBERTの開発: トークナイザと性能の関係編 (3/3)
概要 こんにちは、SB Intuitions株式会社インターンの塚越です。 先日、日本語・英語合わせて約4.4T tokensを学習した日本語ModernBERTというモデルを構築・公開しました。 公開したモデルがどんなモデル、どんな性能なのかについては日本語ModernBERTの開発: 開発と評価編 (1/3)を、開発過程で加えた工夫や分析については…