「好奇心」を使用して報酬の疎なタスクを解決する

ML-Agents ツールキット(v0.4) の新しいバージョンがリリースされました。そのエキサイティングな新機能のひとつが、好奇心に基づく内発的報酬を使用してエージェントのトレーニングを行う機能です。 この機能については多くの説明が必要となるため、追加の記事をお届けすることにしました。この機能によって、(報酬が…