2017-05-24から1日間の記事一覧

将棋でディープラーニングするその22(評価値と勝率の関係)

前回の日記で書いたようにバリューネットワークの学習データとして、elmoの教師データを使用する予定である。elmoの教師データは自己対戦の勝敗だけでなく、深さ6で探索した評価値も同時に出力される。そこで、学習がうまくいっているかの検証用として、elm…