2021-03-18から1日間の記事一覧

将棋AIの実験ノート：方策の分布を学習その３

前回の続き。 dlshogiの強化学習で、方策の分布を含む棋譜を生成し、そのデータを用いてモデルの学習を行い、方策の分布の有無による精度の違いを検証した。棋譜生成 dlshogiの自己対局で、200万局面(29315棋譜)を生成した。学習条件 Resnet10ブロック、活…