将棋でディープラーニングするその15(強化学習)

DeepLearning コンピュータ将棋強化学習 RL policy network

前回まで棋譜を用いた教師あり学習で、将棋の方策ニューラルネットワークを学習した。今回から、強化学習で方策改善を行う。強化学習の手法は、AlphaGoの論文と同じREINFORCE algorithm*1を試す。AlphaGoの論文の強化学習の手法は以下の通りである。 AlphaG…

2017-05-13

将棋でディープラーニングするその14(floodgateの棋譜で学習)

DeepLearning コンピュータ将棋

前回までに調整したニューラルネットワークを、floodgateの棋譜を使って学習した。 floodgateの棋譜の入手 floodgateの棋譜は、コンピュータ将棋対局場の「情報収集」→「棋譜倉庫: 圧縮CSAファイル(7z形式)」から1年単位でアーカイブが入手できる。とりあえ…

2017-05-13

将棋でディープラーニングするその13(ハイパーパラメータの調整)

DeepLearning コンピュータ将棋

ディープラーニング将棋のニューラルネットワーク構成もだいぶ固まってきたので、そろそろ本格的に学習させてみたいが、その前にハイパーパラメータを調整を行った。ハイパーパラメータはベイズ推定など使って調整するのが本当は良いが、そんなに試行数もこ…

2017-05-11

将棋でディープラーニングするその12(Wide ResNetを試す)

DeepLearning コンピュータ将棋

AlphaGoの論文ではSL policy networkは13層のCNNとなっているが、画像認識の分野では単純なDCNNよりGoogLeNet(Inception)やResidual Network(ResNet)が高い精度を上げている。 ResNetで層を増やすのが最も精度が上がるが、層が増えるほど学習時間も増える。R…

2017-05-10

将棋でディープラーニングするその11(Kerasの実装)

DeepLearning コンピュータ将棋

将棋でのディープラーニングをChainerを使って検証していたが、Kerasでも試してみた。13層のDCNNを学習するには、少なくとも全パラメータ数の数倍の訓練データで学習する必要がある。保存したmodelファイルをzipで解凍したファイルの合計サイズが約25MB（nu…

2017-05-08

将棋でディープラーニングするその10(入力特徴から盤面の空の位置を削除)

DeepLearning コンピュータ将棋

GitHubに公開していたソースにバグがあり、Pull requestを頂きました。github.comバグの内容は、入力特徴である盤面の空の位置に先手の駒の位置が混ざっていました。 Pull requestをマージして測定し直しました。 train loss test accuracy 修正前 2.19 0.42…

2017-05-06

将棋でディープラーニングするその7(最適化手法の変更)

DeepLearning コンピュータ将棋

前回に続き、学習の改善を試します。今回は、最適化手法を変えて収束性、精度を測定します。最適化手法は、はじめAdamではうまく学習できなかったためAdaGradとしていました。 Batch Normalizationを入れたことで、Adamを含めた他の手法でも学習できるよう…

2017-05-06

将棋でディープラーニングするその6(BatchNormalizationを追加)

DeepLearning コンピュータ将棋

前回は、手番を入力特徴に加えても効果がないことを確認した。今回は、ニューラルネットワークの畳み込み層の後にBatch Normalizationを追加して精度への影響を確認する。Batch Normalizationを適用することで以下のメリットがある。学習を速く進行させるこ…

2017-05-05

将棋でディープラーニングするその5(入力特徴に手番を追加)

コンピュータ将棋 DeepLearning

世界コンピュータ将棋選手権を参加者の生放送の方で見ていました。開発者の話が聞けて、大変面白かったです。Ponanza Chainerの手法については、後日公開予定ということなので、公開されたら拝見させていただきたいと思います。生放送でもだいぶ中身につい…

2017-05-03

将棋でディープラーニングするその4(ネットワーク構成の変更)

コンピュータ将棋 DeepLearning Chainer

本日から世界コンピュータ将棋選手権が始まりましたね。一次予選を参加者の方の生放送で見ていました。今回からPonanza Chainer以外にもディープラーニングを取り入れて参加している方がちらほらいるようです。こちらの方のアピール文章に、ネットワーク構…

2017-04-10

将棋でディープラーニングするその3(棋譜から学習)

コンピュータ将棋 DeepLearning Chainer

プロの棋譜を使って前回の日記で作成したニューラルネットワークの学習を行った。棋譜サイトにあった竜王戦の棋譜を使用した。訓練データとテストデータの数は以下の通り。訓練データテストデータ局数 3744 417 局面数 422852 47242 学習には非常に時間が…

2017-04-10

将棋でディープラーニングするその2(ニューラルネットワークの構成)

コンピュータ将棋 DeepLearning Chainer

先日の日記に続き、将棋でのディープラーニングの実装を試す。今回は、ニューラルネットワークの構成を検討する。ネットワーク構成ネットワーク構成は、AlphaGoのネットワーク構成を参考にし、13層の畳み込みニューラルネットワーク(DCNN)とする。位置に…

2017-04-08

将棋でディープラーニングする

コンピュータ将棋 DeepLearning

先日の日記で1行もコードを書かずに、将棋におけるディープラーニングについて考察した。コードを書いて実験しないとただの机上の空論になるのでコードを書いて検証してみたいと思う。といっても、将棋のプログラムの実装は行ったことがない。一からコード…

2017-04-06

コンピュータ将棋におけるディープラーニングの考察

AlphaGo コンピュータ将棋 DeepLearning

先日の日記で、コンピュータ将棋とAlphaGoについて言及したが、次のPonanzaがディープラーニングに成功したということで、どのように適用しているのかが気になっている。そこで適当に考察してみる。電王戦のインタビューでもプロの棋譜との一致率について言…

2017-02-26

リアルタイムにマンガの顔パーツ検出を行ってみた

DeepLearning Chainer dlib 顔器官検出

以前に書いた以下の日記の内容を組み合わせて、リアルタイムにマンガの顔パーツ検出を行ってみました。 dlibでマンガの顔認識をやってみた DCNNによるマンガキャラクターの顔パーツ検出 Surfaceのカメラでリアルタイムに顔器官検出を行うリアルタイムにマン…

2017-02-19

写真を線画化する

機械学習 DeepLearning

マンガの顔パーツ検出を試みているが、マンガの顔画像と検出点がセットになった教師データを大量に入手することができない。自分で入力したデータで検出精度の実験を行って、ディープラーニングを使うことで、単一のコミックの画像であればかなりの精度で検…

2017-02-09

DCNNによるマンガキャラクターの顔パーツ検出(追試3)

DeepLearning 機械学習

前回に続き、学習のハイパーパラメータの影響を考察する。今回は、ミニバッチサイズを変更した場合の影響について調べた。ニューラルネットワークの学習は、通常ミニバッチ単位で更新を行う。ミニバッチのサイズは、大きくすると勾配のばらつきが安定するた…

2017-02-07

DCNNによるマンガキャラクターの顔パーツ検出(追試2)

DeepLearning 機械学習

前回の日記で初期値の変更や正則化やBatch Normalization、フィルター枚数などを変更した場合の効果について調べた。ここでは、さらに畳み込み層のゼロパティングの有無とカーネルサイズの影響について調べた。ゼロパティング畳み込み層のパディングは、一…

2017-02-06

DCNNによるマンガキャラクターの顔パーツ検出(追試)

DeepLearning 機械学習 Chainer

前回の日記では正則化など行わずにRMSpropを使用して学習を行ったが、初期値の変更や正則化やBatch Normalizationなどを行った場合にどうなるか試してみた。初期値の変更 ChainerのConvolution2Dのパラメータの初期値は、デフォルトではHeの初期値で初期化…

2017-02-04

DCNNによるマンガキャラクターの顔パーツ検出

DeepLearning Chainer dlib 機械学習

以前の日記でdlibを使用してマンガのキャラクターの顔パーツ検出を行った。しかし、dlibの方法は、マンガキャラクターには有効ではなく、顔パーツを検出できなかった。そこで、DCNNを使用して顔パーツ検出(顔器官検出)ができるか試してみた。 dlibで実装され…

2016-10-31

TensorFlowをGPUを有効にしてWindowsでビルドする

TensorFlow Python DeepLearning CUDA 機械学習

※公式からWindowsバイナリが提供されたため、この記事の内容はほとんどの人には不要です。TensorFlowはビルドツールのBazelがWindowsに対応していないため、Windowsではビルドができなかった。Bash on Windowsを導入することで、Ubuntuのパッケージをバイナ…

2016-06-19

WindowsでCaffeをビルドしてGPUで実行する

Caffe CUDA cuDNN DeepLearning

※2017/3/15追記 Windows版のリポジトリでビルド済みのバイナリが配布されています。自分でビルドしないでもそちらのバイナリを使用することをお勧めします。ビルド済みのバイナリのインストール方法とサンプルの実行方法はこちらの日記を参照ください。Wind…

2016-06-06

学習アルゴリズム変更

AlphaGo DeepLearning 囲碁プログラム

前回の日記で、SGDでSL policy networkを学習し、学習が成功していることが確かめられた。学習アルゴリズムをSGDにしたのは、AlphaGoの論文で採用されていたからだ。収束に非常に時間がかかるので、別の方法だともっと収束が早くならないか試してみた。また…

2016-06-04

SL policy networkの学習

AlphaGo DeepLearning Chainer 囲碁プログラム

前回の日記でChainerで作成したAlphaGoのSL policy networkをプロの棋譜を使って学習させてみた。棋譜は、以前と同様、インターネットの棋譜サイトから入手したプロの棋譜を使用した。まずは、学習がうまくいくか様子をみるため、特徴はAlphaGoの論文のExten…

2016-04-10

Chainerで3層パーセプトロンの誤差逆伝播を実装してみた

Chainer DeepLearning Python 機械学習

前回の記事で、numpyを使って行列演算で3層パーセプトロンを実装しましたが、同じことをChainerを使って実装してみます。 import numpy as np import chainer from chainer import Function, Variable, optimizers from chainer import Link, Chain import c…

2016-04-10

Pythonで3層パーセプトロンの誤差逆伝播を実装してみる

DeepLearning Python 機械学習

入力層、隠れ層、出力層で構成される単純なニューラルネットワークで、誤差逆伝播を計算します。隠れ層の活性化関数はsigmoid、出力層の活性化関数はsoftmaxとします。誤差関数(損失関数)は、交差エントロピーを使用します。それぞれの式は以下の通りです…

2016-03-23

WindowsでChainerを試す

DeepLearning Chainer

音声データの特徴量の抽出を試行錯誤するよりも、ディープラーニング使っちゃえばいいじゃねって考え始めたので、ぼちぼちディープラーニングの勉強を始めました。とりあえず、この本を読み始めました。手を動かさないとモチベーションを保てないので、 …

TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

DeepLearning

将棋でディープラーニングするその15(強化学習)

将棋でディープラーニングするその14(floodgateの棋譜で学習)

将棋でディープラーニングするその13(ハイパーパラメータの調整)

将棋でディープラーニングするその12(Wide ResNetを試す)

将棋でディープラーニングするその11(Kerasの実装)

将棋でディープラーニングするその10(入力特徴から盤面の空の位置を削除)

将棋でディープラーニングするその7(最適化手法の変更)

将棋でディープラーニングするその6(BatchNormalizationを追加)

将棋でディープラーニングするその5(入力特徴に手番を追加)

将棋でディープラーニングするその4(ネットワーク構成の変更)

将棋でディープラーニングするその3(棋譜から学習)

将棋でディープラーニングするその2(ニューラルネットワークの構成)

将棋でディープラーニングする

コンピュータ将棋におけるディープラーニングの考察

リアルタイムにマンガの顔パーツ検出を行ってみた

写真を線画化する

DCNNによるマンガキャラクターの顔パーツ検出(追試3)

DCNNによるマンガキャラクターの顔パーツ検出(追試2)

DCNNによるマンガキャラクターの顔パーツ検出(追試)

DCNNによるマンガキャラクターの顔パーツ検出

TensorFlowをGPUを有効にしてWindowsでビルドする

WindowsでCaffeをビルドしてGPUで実行する

学習アルゴリズム変更

SL policy networkの学習

Chainerで3層パーセプトロンの誤差逆伝播を実装してみた

Pythonで3層パーセプトロンの誤差逆伝播を実装してみる

WindowsでChainerを試す