リバーシAIを作って学ぶ深層強化学習:dlshogi
リバーシ(オセロ)を深層強化学習(DQN)で学習する方法を紹介します。 強化学習(主にQ学習)の基本から解説しています。 GPUでの効率的な実装方法についても解説しています。 作成したコードは、Google ColabのJupyter Notebookで実行できます。 作成したAIと対局することもできます。