KL情報量を利用した時間制御

dlshogi

先日の記事で、dlshogiの手数ごとのポリシーと訪問回数のKL情報量を調査した。KL情報量が高い局面は、探索がより重要になる局面と考えられるため、KL情報量を時間制御に使用することを考えた。現状の時間制御現状のdlshogiは、以下の式で1手にかける時間を…

手数ごとのポリシーと訪問回数のKL情報量

dlshogi

山下さんがAobaZeroのKL情報量を調べていて、気になったのでdlshogiでも調べてみた。 KL情報量は、2つの確率分布の差異を測る指標である。ニューラルネットワークで予測したポリシーと、MCTSで探索した結果のルートノードでの訪問回数のKL情報量を測ること…

dlshogi

以前にCUDAマルチストリームに対応した際、8GPUだと、CPU-GPU間の帯域がボトルネックとなり、NPSが上がらない課題があることがわかった。対策として、FP16で転送することを検討し、NPSが平均で18.4%向上することを確認した。 GPU数とNPS GPU数とNPSの関係を…

このブログは無味乾燥な実験結果ばかり書いているが、たまには書評も書いてみる。最近読み終わった本で、「ディープラーニング学習する機械ヤン・ルカン、人工知能を語る」がとても面白かったので紹介する。実は人文書タイトルだけみると理系の工学系の…

dlshogi

昨年11月に行われた第2回電竜戦では、A級リーグでは先手勝率が70%と高かったことがコンピュータ将棋関係者の間で話題になった。また、戦型は相掛かりが多かった。角換わりは後手が千日手を狙いやすく、有利な先手で後手に千日手にされないように定跡で角換…

dlshogi

年末にDiscordのやりとりで、dlshogiの入力特徴量作成で、各マスの利きを求めるために、各マス×手番ごとにattackersToを呼び出すのは無駄と、やねうら氏からご指摘をいただいた。その通りなので、改善を行った。改善したコード各マスの利きをattackersTo…