2019-11-28から1日間の記事一覧

AlphaStarの論文を読むその９（マルチエージェント学習）

AlphaStar 強化学習

マルチエージェント学習リーグトレーニングはマルチエージェント強化学習アルゴリズムであり、セルフプレイトレーニング中によく発生するサイクルに対処し、多様な戦略を統合するために設計されている。訓練中に、エージェント（RLアルゴリズムによって訓…