リバーシ（オセロ）を深層強化学習（DQN）で学習する方法を紹介します。強化学習(主にQ学習)の基本から解説しています。 GPUでの効率的な実装方法についても解説しています。作成したコードは、Google ColabのJupyter Notebookで実行できます。作成したAIと対局することもできます。

リバーシAIを作って学ぶ深層強化学習：dlshogi