中国製LLMの内部に隠された検閲メカニズムを初めて可視化 — AIの「思考」を重みパラメータから読み取る新手法

5月19日、AI研究者のVasが「What political censorship looks like inside an LLM's weights」と題した記事を公開した。この記事では、これまでブラックボックスだったLLM(大規模言語モデル)の内部で動作する政治的検閲メカニズムを、重みパラメータレベルで初めて数値的に可視化した画期的な研究について詳しく紹介され…