TadaoYamaokaの日記

山岡忠夫Homeで公開しているプログラムの開発ネタを中心に書いていきます。

2021-01-21から1日間の記事一覧

将棋AIの進捗 その54(補助ターゲット)

深層強化学習では、メインの学習タスクに加えて、補助タスクを同時学習することで、パフォーマンスを改善するということが行われている。 [1611.05397] Reinforcement Learning with Unsupervised Auxiliary Tasks 囲碁AIの例 囲碁AIのKataGoでは、 占領した…