評価
AlphaStar Battle.netの評価
- AlphaStarエージェントは、StarCraft IIバランスパッチ4.9.3で、MMRレーティングに基づくBlizzardのオンラインマッチメイキングシステムBattle.netで人間に対して評価された。
- AlphaStar Finalは、グランドマスターレベル(過去数か月でヨーロッパのサーバ(約90,000人のプレイヤー)のリーグで十分アクティブだった人間プレイヤーの99.8%を超える)と格付けされた。
対戦相手、匿名アカウント、ハードウェア、評価時点
教師ありおよび中間点の評価の開始ランク
- 教師ありおよび中間点の評価のために、各エージェントは新しいランク付けされていないアカウントで開始した。
MMR
- それらのMMRは、人間と同様にBattle.netで更新された。
- 教師ありおよび中間点の評価では、それぞれ30ゲームと60ゲームをプレイした。
- まだ増加していたが、50ゲーム後に匿名性の制約が損なわれたため、中間点の評価は中止された。
StarCraftデモンストレーションでの評価
- 2018年12月、私たちはStarCraft IIプロプレイヤーGrzegorz “MaNa” KominczとDario “TLO” Wünschに対して5つのゲームシリーズを2回プレイしましたが、TLOは彼がプロとしてプレイするのと同じStarCraft II種族でプレイしなかった。
- これらのゲームは、AlphaStarの別の予備バージョンで行われた*2。
- 特に、エージェントはカメラが制限されておらず、また行動の頻度が制限されておらず、1つのマップに1つのStarCraft II種族で対戦していた。
- AlphaStarは両方の5ゲームシリーズで10ゲームすべてに勝利したが、初期のカメラプロトタイプはMaNaに対するフォローアップゲームを失った。
感想
最終的な結果は、グランドマスターレベル(人間の上位99.8%)に達しています。
人間と同じ条件で強さを測定するための測定条件の詳細が述べられています。
人間にはAlphaStarだとわからないように匿名アカウントでプレイされています。
中間点の評価では途中で特定されてしまったようです。
人間との対戦では、ハイエンドコンシューマGPU1枚で実行されています。
探索を行っていないので、それほどGPU性能は必要なさそうです。
(続く)
AlphaStarの論文を読む - TadaoYamaokaの開発日記
AlphaStarの論文を読む その2 - TadaoYamaokaの開発日記
AlphaStarの論文を読む その3 - TadaoYamaokaの開発日記
AlphaStarの論文を読む その4 - TadaoYamaokaの開発日記
AlphaStarの論文を読む その5(アーキテクチャ) - TadaoYamaokaの開発日記
AlphaStarの論文を読む その6(アーキテクチャその2) - TadaoYamaokaの開発日記
AlphaStarの論文を読む その7(アーキテクチャその3) - TadaoYamaokaの開発日記
AlphaStarの論文を読む その8(教師あり学習、強化学習) - TadaoYamaokaの開発日記
AlphaStarの論文を読む その9(マルチエージェント学習) - TadaoYamaokaの開発日記
AlphaStarの論文を読む その10(リーグ構成) - TadaoYamaokaの開発日記
AlphaStarの論文を読む その11(インフラ) - TadaoYamaokaの開発日記
AlphaStarの論文を読む その12(評価) - TadaoYamaokaの開発日記
AlphaStarの論文を読む その13(分析、AlphaStarの一般性) - TadaoYamaokaの開発日記