TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

2019-11-14から1日間の記事一覧

AlphaStarの論文を読む その5(アーキテクチャ)

しばらく空きましたが、続きです。 アーキテクチャは長いので途中までです。 アーキテクチャ AlphaStarの方策は関数で、以前のすべての観測とアクションおよび𝑧(戦略統計を表す)を現在のステップの行動の確率分布にマッピングする 拡張データ表1 | エージ…