山下さんがAobaZeroのKL情報量を調べていて、気になったのでdlshogiでも調べてみた。 KL情報量は、2つの確率分布の差異を測る指標である。 ニューラルネットワークで予測したポリシーと、MCTSで探索した結果のルートノードでの訪問回数のKL情報量を測ること…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。