Stability AI、初のオープンソースRLHF LLMチャットボット、StableVicuna をリリース — Stability AI Japan
StableVicunaは、人間のフィードバックから強化学習(RLHF)により学習させた、初の大規模なオープンソースチャットボットです。StableVicunaは、Vicuna v0 13bをさらに細かく指示で微調整し、RLHFで学習させたバージョンで、細かく命令調整したものです。 LLaMA13bモデルです。興味のある読者のために、以下の内容を紹介…