はじめに敵対的模倣学習の圏論的解釈について紹介します。近年、敵対的模倣学習 (GAIL) や RLHF はAIの根幹技術ですが、「なぜ非凸なニューラルネットワークで学習が収束する（均衡が存在する）のか？」という問いに対し、従来の理論は無力でした。今回紹介するメモ書き...

生成AIの収束先の存在を圏論で証明する - Qiita