その2の続き今回は対局時の探索アルゴリズムについてです。 探索アルゴリズム 対局時はpolicyとvalueを使ったモンテカルロ木探索(APV-MCTS)を使用する。 探索は複数スレッドで並列に行う。探索木の各ノードsは以下の情報を持つ。 N(s,a) 行動aの訪問回数 W(s…
18日から提供開始されたWindows 10 Fall Creators Updateを適用しました。今バージョンからコマンドプロンプトのカラースキーム変更になるということです。 今までコマンドプロンプトの青の文字が非常に読みづらく、Bash on Windowsを使うようになってから特…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。