次の技術書典のネタとしてPythonでAlphaZero Shogiの完全コピーを実装しています。
自己対局と学習がようやく動くようになりました。
入力特徴と出力ラベルと探索の仕様はAlphaZero Shogiと完全に一致させました。
入力特徴
- 先手の駒 14
- 後手の駒 14
- 繰り返し数 3
- 先手の持ち駒の数 7
- 後手の持ち駒の数 7
- 手番 1
- 手数1
- 履歴8局面
出力ラベル
- 移動方向×移動距離 64
- 桂馬の動き 2
- 移動方向×移動距離(成り) 64
- 桂馬の動き(成り) 2
- 駒打ち 7
次の技術書典のネタとしてPythonでAlphaZero Shogiの完全コピーを実装しています。
自己対局と学習がようやく動くようになりました。
入力特徴と出力ラベルと探索の仕様はAlphaZero Shogiと完全に一致させました。