TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

2017-11-08から1日間の記事一覧

将棋でディープラーニングするその44(L2正則化)

AlphaGo Zero DeepLearning コンピュータ将棋

将棋AIのPolicy NetworkとValue Networkのマルチタスク学習でのL2正則化の効果を測定してみた。正則化なし loss policy accuracy value accuracy L2正則化係数 loss policy accuracy value accuracy 考察正則化なしでも、trainとlossにそれほど差がないが…

将棋でディープラーニングするその43(ValueNetの出力をtanhにする2)

AlphaGo コンピュータ将棋 DeepLearning

前回、Value Networkの出力をtanhにした場合とsigmoidにした場合で比較を行ったが、マルチタスク学習を行っているため、はっきりした結果がわからなかった。今回は、Value Networkのみの学習で比較を行った。以下の2パターンで比較した。出力関数損失関数…