2021-03-16から1日間の記事一覧

将棋AIの実験ノート：方策の分布を学習その２

以前に、指し手を学習するより、方策の分布を学習した方が、方策の精度が上がるということを書いた。しかし、現在、dlshogiの強化学習で生成している教師局面フォーマット(hcpe)では、方策の分布を記録していない。そこで、方策の分布を出力できるように、…