先日の世界コンピュータ将棋選手権で、dlshogiはMulti Ponderを実装していた。
相手番で相手局面を探索するStochastic Ponderという手法と組み合わせることで、追加コストゼロで候補手をN手取得できるため、Multi PonderはMCTSと相性がよいクラスタリング手法である。
手法の詳細は、先日の記事に書いたので参照して欲しい。
どれくらい効果があったか把握するため、大会でのPonderのヒット率について集計した。
計測対象
二次予選 9対局、決勝 7対局について調べた。
ヒット率
いずれかにヒット
8台のサーバのいずれかにヒットした割合は以下の通りであった。
局面数 | 1640 |
---|---|
ヒット率 | 94.817% |
候補手ごと
0番目の候補手から7番目の候補手のどれにヒットしたかを分けて計測した際の割合は以下の通り。
0番 | 1番 | 2番 | 3番 | 4番 | 5番 | 6番 | 7番 |
---|---|---|---|---|---|---|---|
65.304% | 13.963% | 6.280% | 3.658% | 1.524% | 1.646% | 1.158% | 1.280% |
上位4つ(3番まで)で、89.2%がヒットしている。
4台あれば、十分に効果を発揮しそうである。
序盤、中盤、終盤ごと
序盤、中盤、終盤ごとに分析した。
適当だが、序盤は24手まで、中盤25手~150手、終盤は150手以降とした。
序盤 | 中盤 | 終盤 | |
---|---|---|---|
局面数 | 192 | 982 | 466 |
ヒット率 | 92.708% | 98.472% | 87.982% |
中盤のヒット率が特に高いことがわかった。
序盤は、定跡によって戦型を決めている場合や、NNUE系の序盤とdl系で違いがあるためと考えられる。また、序盤は定跡で抜けているため、Stochastic Ponderの探索時間が短いことも影響していそうである。
終盤が最も低くなっているのは、相手がすでに負けの状況で意味なく手数を伸ばそうとする場合の指し手はほとんど意味を持たないためと考えられる。
まとめ
世界コンピュータ将棋選手権で、Multi Ponderのヒット率は、94.817%であったことが分かった。
dlshogiのStochastic Ponderと組み合わせること、高いヒット率が実現できていた。
特に中盤では、98.472%がヒットしていた。
候補手上位4つで、89.2%がヒットしていたため、サーバは4台でも十分な効果が期待できる。