TRL - 強化学習によるLLMの学習のためのライブラリ |npaka
「TRL」のドキュメントを簡単にまとめました。 ・trl v0.4.2 1. TRL 「TRL」(Transformer Reinforcement Learning) は、強化学習を使用してTransformer言語モデルを学習できます。このライブラリはHuggingFace Transformersと統合されています。 「TRL」は、「GPT-2」「BLOOM」「GPT-Neo」などのデコーダモデルをサ…