2次予選1局のKristallweizenとの対局について、敗因を分析してみた。
評価値は以下のようになっており、Kristallweizen側の評価値も124手で先手が優勢となっていた。
125手目の2七桂打が悪手で、一手で後手優勢に傾いた。
125手目の局面を、Aperyで分析すると最善手は2五桂打で先手に405点有利となっていた。
2七桂打は、後手が992点有利となった。
dlshogiのpolicyの確率とvalueの勝率と、探索後の勝率は、
policy | value | 探索後の勝率 | |
---|---|---|---|
2七桂打(dlshogiの着手) | 0.0461798 | 0.670166 | 0.828524 |
2五桂打(Aperyの最善手) | 0.312096 | 0.671631 | 0.68564 |
となっており、policyは正しく最善手を予測できていた。
valueは、1手後の局面を正しく予測できていない。
探索後の勝率も、誤差がより広がっていた。
2七桂打の後のPVは、2六龍を読んでいたが、実際指されたのは6六角成でこれが敗因となった。
6六角成を指された後の局面では、後手優勢に気付いている。
短い時間(10秒)の探索では先手有利となったため、深く探索しないと気付かない局面となっていた。
2七桂打を指した後の後手の局面でも、長く探索すると6六角成を読めていた。
2七桂打を指した後の後手の局面のpolicyの確率とvalueの勝率は以下の通りとなっていた。
policy | value | |
---|---|---|
2六龍(dlshogiのPV) | 0.330778 | 0.438965 |
6六角成(実際に指された手) | 0.130268 | 0.308594 |
ここでは、policy、valueともに最善手から外れていた。
終盤の複雑な局面でのモデルの精度が低いことが原因と言えそうだ。
また、深く読めば気付けているため、終盤の複雑な局面に時間配分をした方がよさそうだ。
実際の対局では3秒で指していた。