Anthropic からの挑戦状!|ぬこぬこ

tl;dr Anthropic からConstitutional Classifiers が公開されたよ ユニバーサルジェイルブレイクを試すデモが公開されたよ 2/12 現在、既にクローズしています。Claude の次のモデルの公開間近?→2/25 に Claude 3.7 Sonnet が公開 Constitutional Classifiers: Defending against Universal Jailbreaks ac…