ハースストーンのAIコンペ

ハースストーン MCTS

不完全情報ゲームのAIの論文を調べていて、たまたまハースストーンのAIコンペがあることを知ったので、試したいこともあったのでさくっとMCTSのプログラムを作って提出してみた。ハースストーンは、相手の手札や山札は見ることができない不完全情報ゲームで…

2020-01-13

将棋AIの進捗その37(FPU reduction)

dlshogi MCTS コンピュータ将棋

昨日、MCTSで未訪問のノードの価値を、動的に親ノードの価値で初期化する方法を試した。その結果、技巧2(4コア)に対する勝率が、60%から69%(R+68.6)になった。昨日の結果の考察今までは0.5(引き分け)で初期化していたため、劣勢の局面で未探索のノードが…

2020-01-12

将棋AIの進捗その36(UCBの価値の初期値)

dlshogi コンピュータ将棋 MCTS

AlphaZeroのMCTSのUCBには、という式が使用されており、このUCBで行動価値の信頼区間の上限を見積もっている。は、行動の行動価値を、探索を行った結果得られた価値の平均で推定する。ここで、のときは未定義であるため、何らかの値で推定する必要がある。…

2019-08-13

将棋AIの進捗その33(末端ノードでの詰み探索)

dlshogi MCTS コンピュータ将棋

dlshogiでは末端ノードで短手数(7手)の詰み探索を実施しているが、終盤ではゲーム木中に詰みの局面が多くなり、王手の合法手も多くなるため、探索速度が大幅に低下することがあった。先日、MCTSにAND/OR木を組み込む実装を行ったことで、MCTSで詰み探索を行…

2019-08-10

将棋AIの進捗その32(MCTSの探索にAND/OR木を導入する)

dlshogi コンピュータ将棋 MCTS

Leela Chess Zeroの状況を定期的にウォッチしないとなと思って、issueを眺めていたら"Exact-Win Strategy for Overcoming AlphaZero" #799という投稿がされていた。 Leela Zeroのissue#2276にも同様の投稿がある。ざっくり説明すると、子ノードが勝ちの場合…

2018-05-06

将棋AIの進捗その21(探索の深さ)

dlshogi MCTS コンピュータ将棋

dlshogiでは、MCTSの末端ノードでバリューを計算し、その値をバックアップしているが、GPUでバリューの計算が終わるまで待機している。バリューの計算が終わる前に次の探索を始めると、ノードにバーチャルロスのみが反映された状態で、勝敗の推定値が反映さ…

TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

MCTS

ハースストーンのAIコンペ

将棋AIの進捗その37(FPU reduction)

将棋AIの進捗その36(UCBの価値の初期値)

将棋AIの進捗その33(末端ノードでの詰み探索)

将棋AIの進捗その32(MCTSの探索にAND/OR木を導入する)

将棋AIの進捗その21(探索の深さ)

ハースストーンのAIコンペ

将棋AIの進捗 その37(FPU reduction)

将棋AIの進捗 その36(UCBの価値の初期値)

将棋AIの進捗 その33(末端ノードでの詰み探索)

将棋AIの進捗 その32(MCTSの探索にAND/OR木を導入する)

将棋AIの進捗 その21(探索の深さ)

将棋AIの進捗その37(FPU reduction)

将棋AIの進捗その36(UCBの価値の初期値)

将棋AIの進捗その33(末端ノードでの詰み探索)

将棋AIの進捗その32(MCTSの探索にAND/OR木を導入する)

将棋AIの進捗その21(探索の深さ)