第32回世界コンピュータ将棋選手権決勝の優勝決定戦について、dlshogi側の評価値は以下のようになっていました。
112手目まではほぼ互角と判断していました。
114手目くらいから徐々に先手優勢になって、逆転となった166手目の手前では、評価値-720でした。
逆転となった166手目
166手目△4九角打で、少し評価値が良くなりましたがまだ先手有利の評価値で、▲6三とでほぼ互角の評価になりました。
これはMCTSでは、探索結果の終端ノードの評価値(勝率)を平均化しているため、勝ちの手順を見つけていても、他の手順も調べているとすぐには評価値に反映されないことが関係しています。
▲6三と以外だったら
166手目のdlshogiの読み筋は▲9七玉となっていましたが、▲9七玉と進んだ局面では、△7五銀が必至になっていましたので勝ちは揺るがなかったようです。
第32回世界コンピュータ将棋選手権の優勝決定戦である、☗二番絞り VS ☖dlshogi with HEROZ の解説記 - あらきっぺの将棋ブログ
なお、dlshogiも▲9七玉と進んだ局面では、△7五銀を発見できるようです。
ただし、USIオプションのUCT_Threadが4だと△9一玉を選んですぐには勝てない手順になりました。UCT_Thread=3だと発見できました。
NPSを上げるため、並列度を上げ過ぎると精度が落ちる場合があること、あらためて認識しました。
感想
自宅で対局中にログの評価値を眺めていて-700くらいになった時点で、見るのがつらくなったので、画面から離れていました。
やはり気になって確認したらなぜか評価値が30000になっていて目を疑いました。
中継サイトでも先手投了になっていたので、dlshogiが勝ったことを認識しました。
逆転の瞬間を見逃してしまって、残念です。
川崎の会場ではだいぶ盛り上がっていたようです。
この写真が好きです。
評価値大逆転の瞬間#csalive #wcsc32 pic.twitter.com/C7QF2nD1L2
— mtmt (@mtmtlife) 2022年5月5日