trlを使って日本語LLMをSFTからRLHFまで一通り学習させてみる | 株式会社AI Shift

AI ShiftのTECH BLOGです。AI技術の情報や活用方法などをご案内いたします。