TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

2022-01-29から1日間の記事一覧

手数ごとのポリシーと訪問回数のKL情報量

山下さんがAobaZeroのKL情報量を調べていて、気になったのでdlshogiでも調べてみた。 KL情報量は、2つの確率分布の差異を測る指標である。 ニューラルネットワークで予測したポリシーと、MCTSで探索した結果のルートノードでの訪問回数のKL情報量を測ること…