強化学習

強化学習は、コンピュータによる学習方法の一つで、教師なし学習に分類される場合もある。システムのある行動選択に基づき、それに対する得点(報酬)を与える事で学習を行なう。代表的な方法であるQ学習について、実装可能レベルでアルゴリズムの説明をし、実行例も示している。