生成AIの収束先の存在を圏論で証明する - Qiita

はじめに 敵対的模倣学習の圏論的解釈について紹介します。 近年、敵対的模倣学習 (GAIL) や RLHF はAIの根幹技術ですが、「なぜ非凸なニューラルネットワークで学習が収束する(均衡が存在する)のか?」という問いに対し、従来の理論は無力でした。 今回紹介するメモ書き...