はじめに最近は大規模言語モデルを作っています｡主に2-3月はデータセット構築や事前学習に取り組んできました｡概ね､手応えがつかめてきたので､次はファインチューニングの練習をしていきます｡本記事は､その日記です｡ 3/26まで: システムのセットアップ HuggingFace形式のモデルをinstruction tuningして､日本語…

10b程度のモデルをファインチューニングする日記 (逐次更新)｜Kan Hatakeyama