10b程度のモデルをファインチューニングする日記 (逐次更新)|Kan Hatakeyama

はじめに 最近は大規模言語モデルを作っています。 主に2-3月はデータセット構築や事前学習に取り組んできました。 概ね、手応えがつかめてきたので、次はファインチューニングの練習をしていきます。本記事は、その日記です。 3/26まで: システムのセットアップ HuggingFace形式のモデルをinstruction tuningして、日本語…