wcsc29で負けた対局の分析 - TadaoYamaokaの開発日記

2次予選1局のKristallweizenとの対局について、敗因を分析してみた。

評価値は以下のようになっており、Kristallweizen側の評価値も124手で先手が優勢となっていた。
f:id:TadaoYamaoka:20190506231639p:plain

125手目の２七桂打が悪手で、一手で後手優勢に傾いた。

125手目の局面を、Aperyで分析すると最善手は２五桂打で先手に405点有利となっていた。
２七桂打は、後手が992点有利となった。

dlshogiのpolicyの確率とvalueの勝率と、探索後の勝率は、

	policy	value	探索後の勝率
２七桂打(dlshogiの着手)	0.0461798	0.670166	0.828524
２五桂打(Aperyの最善手)	0.312096	0.671631	0.68564

となっており、policyは正しく最善手を予測できていた。
valueは、1手後の局面を正しく予測できていない。
探索後の勝率も、誤差がより広がっていた。

２七桂打の後のPVは、２六龍を読んでいたが、実際指されたのは６六角成でこれが敗因となった。
６六角成を指された後の局面では、後手優勢に気付いている。
短い時間（10秒）の探索では先手有利となったため、深く探索しないと気付かない局面となっていた。
２七桂打を指した後の後手の局面でも、長く探索すると６六角成を読めていた。

２七桂打を指した後の後手の局面のpolicyの確率とvalueの勝率は以下の通りとなっていた。

	policy	value
２六龍(dlshogiのPV)	0.330778	0.438965
６六角成(実際に指された手)	0.130268	0.308594

ここでは、policy、valueともに最善手から外れていた。

終盤の複雑な局面でのモデルの精度が低いことが原因と言えそうだ。
また、深く読めば気付けているため、終盤の複雑な局面に時間配分をした方がよさそうだ。
実際の対局では3秒で指していた。