言語モデルの編集に関する論文紹介|sergicalsix

論文名 Is Bigger Edit Batch Size Always Better? - An Empirical Study on Model Editing with Llama-3 arXivリンク https://arxiv.org/pdf/2405.00664 ひとこと要約 Llama-3を用いた言語モデルの編集と層の位置やバッチサイズの関係を調査 メモ 編集手法 前提知識: 編集では、新しい事実を記憶させる「me…