マルチタスク学習

2017-06-15

将棋でディープラーニングするその35(マルチタスク学習(補足))

試している将棋でのディープラーニングについて、PUCTの実装をRay+Rnのソースコードを参考に行っていますが、囲碁部分のコードを将棋に置き換えるのがわりと面倒で、完成にはもうしばらくかかりそうです。その間に、追加でモデル学習の実験を行いました。今…

2017-06-08

将棋でディープラーニングするその33(マルチタスク学習)

DeepLearning コンピュータ将棋マルチタスク学習

SL policy networkとValue networkは、12層までは同じ構成で、出力の数層のみが異なるため、12層まで同じネットワークでそこから2つの出力を行うようにして、SL policy networkとValue networkを同時に学習することを試してみた。複数のタスクを同時に学習す…

TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

マルチタスク学習

将棋でディープラーニングするその35(マルチタスク学習(補足))

将棋でディープラーニングするその33(マルチタスク学習)

将棋でディープラーニングする その35(マルチタスク学習(補足))

将棋でディープラーニングする その33(マルチタスク学習)

将棋でディープラーニングするその35(マルチタスク学習(補足))

将棋でディープラーニングするその33(マルチタスク学習)