2020-01-27から1日間の記事一覧

2020-01-27

リバーシ(オセロ)で深層強化学習その７（Prioritized Experience Replay）

強化学習オセロ PyTorch リバーシ

リバーシ(オセロ)で深層強化学習を試すシリーズ、前回からしばらく空いたが、今回はPrioritized Experience Replayを試す。 Prioritized Experience Replay 強化学習では、サンプルの時間依存の相関を弱めるために、サンプルを乱択する経験再生（experience …

TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

2020-01-27から1日間の記事一覧

リバーシ(オセロ)で深層強化学習その７（Prioritized Experience Replay）

2020-01-27から1日間の記事一覧

リバーシ(オセロ)で深層強化学習 その７（Prioritized Experience Replay）

リバーシ(オセロ)で深層強化学習その７（Prioritized Experience Replay）