2022-01-01から1ヶ月間の記事一覧
先日の記事で、dlshogiの手数ごとのポリシーと訪問回数のKL情報量を調査した。KL情報量が高い局面は、探索がより重要になる局面と考えられるため、KL情報量を時間制御に使用することを考えた。 現状の時間制御 現状のdlshogiは、以下の式で1手にかける時間を…
山下さんがAobaZeroのKL情報量を調べていて、気になったのでdlshogiでも調べてみた。 KL情報量は、2つの確率分布の差異を測る指標である。 ニューラルネットワークで予測したポリシーと、MCTSで探索した結果のルートノードでの訪問回数のKL情報量を測ること…
以前にCUDAマルチストリームに対応した際、8GPUだと、CPU-GPU間の帯域がボトルネックとなり、NPSが上がらない課題があることがわかった。 対策として、FP16で転送することを検討し、NPSが平均で18.4%向上することを確認した。 GPU数とNPS GPU数とNPSの関係を…
このブログは無味乾燥な実験結果ばかり書いているが、たまには書評も書いてみる。最近読み終わった本で、「ディープラーニング 学習する機械 ヤン・ルカン、人工知能を語る」がとても面白かったので紹介する。 実は人文書 タイトルだけみると理系の工学系の…
昨年11月に行われた第2回電竜戦では、A級リーグでは先手勝率が70%と高かったことがコンピュータ将棋関係者の間で話題になった。 また、戦型は相掛かりが多かった。 角換わりは後手が千日手を狙いやすく、有利な先手で後手に千日手にされないように定跡で角換…
年末にDiscordのやりとりで、dlshogiの入力特徴量作成で、各マスの利きを求めるために、各マス×手番ごとにattackersToを呼び出すのは無駄と、やねうら氏からご指摘をいただいた。 その通りなので、改善を行った。 改善したコード 各マスの利きをattackersTo…