バンディット問題の理論とアルゴリズム

後悔のない選択肢をあぶり出せ! 方策やリグレット解析などの基礎理論を丁寧に解説。最適腕識別や連続腕バンディットはもちろんのこと、モンテカルロ木探索やインターネット広告などのより具体的な状況への対応も紹