TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

WCSC32版dlshogiが公開しているモデルからどれくらい強くなっているか

第32回世界コンピュータ将棋選手権で優勝したdlshogi with HEROZが、第2回世界将棋AI電竜戦エキシビジョンバージョン(公開しているモデル)からどれくらい強くなっているかちゃんと測定していなかったので、測定した。

測定条件

  • dlshogiは2スレッド、1GPU(A100)
  • 水匠5は32スレッド
  • dlshogiは秒読み10秒、水匠5は15秒

上記測定条件で、初期局面なしで平手からランダムプレイありの場合と、10手目互角局面集を使った場合の2パターン測定した。

ランダムプレイありの場合、24手まで評価値2%範囲(1手ごと0.1%範囲縮小)でランダムで指し手を選択する。

10手目互角局面集は、dlshogiの評価値が最善手から5%の範囲+振り飛車定跡を調べて、dlshogiの1千万ノード探索で評価値150未満の局面を抽出している。
振り飛車の局面を含む、様々な戦型が含まれている。

測定結果

初期局面なし(平手から)
   # PLAYER          :  RATING  ERROR  POINTS  PLAYED   (%)  CFS(%)    W    D    L  D(%)
   1 wcsc32          :   118.2   21.6   385.0     534    72     100  358   54  122    10
   2 suisho5-32th    :   -53.8   20.6   214.0     534    40      73  185   58  291    11
   3 dr2_exhi        :   -64.4   20.2   205.0     540    38     ---  179   52  309    10

White advantage = 93.10 +/- 12.42
Draw rate (equal opponents) = 11.50 % +/- 1.19

wcsc32が、第32回世界コンピュータ将棋選手権で優勝したdlshogi with HEROZ、dr2_exhiが第2回世界将棋AI電竜戦エキシビジョンバージョンである。

WCSC32版のdlshogiの方が、R+182.6だけ強い。

互角局面集
   # PLAYER          :  RATING  ERROR  POINTS  PLAYED   (%)  CFS(%)    W    D    L  D(%)
   1 wcsc32          :   120.8   23.4   294.0     401    73     100  263   62   76    15
   2 dr2_exhi        :   -23.0   22.0   183.0     403    45     100  147   72  184    18
   3 suisho5-32th    :   -97.9   23.2   123.0     396    31     ---   92   62  242    16

White advantage = 36.00 +/- 14.18
Draw rate (equal opponents) = 18.41 % +/- 1.69

WCSC32版のdlshogiの方が、R+143.8だけ強い。

固定ノード

同じノード数探索した場合の、強さも比較した。
dlshogiは10万ノード探索、水匠5は4千万ノード探索した場合、平手からランダムプレイありで対局した結果は以下の通り。

   # PLAYER                :  RATING  ERROR  POINTS  PLAYED   (%)  CFS(%)    W    D    L  D(%)
   1 wcsc32-nodes100k      :    89.5   20.9   339.5     509    67     100  317   45  147     9
   2 suisho5-nodes40m      :   -21.2   20.1   231.5     503    46     100  203   57  243    11
   3 dr2_exhi-nodes100k    :   -68.3   20.9   191.0     512    37     ---  165   52  295    10

White advantage = 112.65 +/- 13.01
Draw rate (equal opponents) = 11.23 % +/- 1.24

WCSC32版のdlshogiの方が、R+157.8だけ強い。

NPSの比較

初期局面で10秒探索時のNPSは以下の通り。

wcsc32 43990
dr2_exhi 57548

wcsc32のNPSは、dr2_exhi|のNPSの76.4%になる。

これは、wcsc32のモデルが20ブロック256フィルタというより大きなモデルを使用しているためである。
dr2_exhiの方は、15ブロック224フィルタである。

NPSは低下しているが、NPS向上による強さへの影響は、NPSが2倍になってもR+71.6程度である。

考察

WCSC32版のdlshogiのモデルは、公開しているdr2_exhi版より、R+144~R+183程度強くなっている。

モデルサイズが20ブロックになったことでNPSは低下しているが、第2回世界将棋AI電竜戦エキシビジョンマッチ以降に行った強化学習と、モデルを20ブロックにしたことによるモデルの精度向上が強さに寄与している。


なお、第2回世界将棋AI電竜戦エキシビジョンマッチから探索部も改善しているため、第2回世界将棋AI電竜戦エキシビジョンマッチ時点の探索部とモデルとの比較では、もっと差があるはずである。
今回の測定では、探索部はどちらも最新を使っている。

まとめ

最新のdlshogiが、公開しているモデルからどれくらい強くなっているかを測定した。
結果、R+144~R+183程度強くなっていることが確かめられた。

2022/6/28追記

ソフト間の勝率は以下の通り。

dr2_exhi vs wcsc32: 31-153-18 (19.8%)
Black vs White: 107-77-18 (57.4%)
dr2_exhi playing Black: 22-68-11 (27.2%)
dr2_exhi playing White: 9-85-7 (12.4%)
wcsc32 playing Black: 85-9-7 (87.6%)
wcsc32 playing White: 68-22-11 (72.8%)

dr2_exhi vs suisho5-32th: 103-77-22 (56.4%)
Black vs White: 97-83-22 (53.5%)
dr2_exhi playing Black: 51-31-19 (59.9%)
dr2_exhi playing White: 52-46-3 (53.0%)
suisho5-32th playing Black: 46-52-3 (47.0%)
suisho5-32th playing White: 31-51-19 (40.1%)

suisho5-32th vs wcsc32: 64-113-21 (37.6%)
Black vs White: 128-49-21 (69.9%)
suisho5-32th playing Black: 52-37-10 (57.6%)
suisho5-32th playing White: 12-76-11 (17.7%)
wcsc32 playing Black: 76-12-11 (82.3%)
wcsc32 playing White: 37-52-10 (42.4%)