DeepLearningによる将棋の学習5~損失の配分を変更~

前回はフィルタサイズを変更してもうまくいかないことを確認しました。 個人的にはDeepLearningによる学習でValueの学習がなかなかうまくいかないという点が気になっています。マルチタスク学習をさせているので損失は指し手の一致具合とValueの一致具合の和を取っている loss_op = tf.reduce_mean(tf.nn.sparse_softmax_c…