将棋AIの進捗その35(PyTorchに移行)

dlshogi PyTorch Chainer

年末に新しいCPUが届いたので、正月はPCを組んでいた。同時にフルタワーケースを買ったのだが、GPU3枚だと熱対策をしないと安定動作しなかったので、ドリルで加工してファンを増設したりと正月から働いてしまったorz 安定動作するようになったので、前回記…

2019-05-14

2値分類で中間の値も学習する（続き）

DeepLearning Chainer

昨日書いた2値分類で中間の値も学習するコードは、損失の計算で計算グラフを構築して、backward()時の微分はChainerに任せていた。しかし、交差エントロピーの微分は、以下のように引き算で表すことができるため、計算グラフを構築しなくてもよい。交差エン…

2019-04-16

ビルド済みChainerからソースビルド版に戻す

Python Chainer Windows

Chainer/CupyはWindowsは正式にサポートされていないが、問題なく動作する。最近のバージョンでは、Windows向けにもビルド済みパッケージも提供されているので、以前は必要だったVisual Studioがなくてもインストールできる。先日、開発環境をVisual Studio…

2019-04-05

Python環境をVisual Studio 2017に移行

Visual Studio Python Chainer TensorFlow Windows

Python3.5はVisual Studio 2015でビルドされているため、余計なトラブルを避けるためVisual Studio 2015を使い続けてきた。最近、Visual Studio 2015が起動して数分後に30秒くらい固まる現象が起きて、再インストールしたりしたが直らないので、しばらく我慢…

2019-02-19

畳み込み層とBatchNormalizationのレイヤー融合をChainerで試してみた

Chainer DeepLearning

畳み込み層のフィルタは行列で表すことができる。 BatchNormalizationも、入力の要素ごとに適用するスカラーの式だが、カーネルサイズ1×1の畳み込みで表すことができる。推論のフェーズでは、BatchNormalizationの平均と分散は、学習時の統計情報を使うこと…

2018-04-21

Chainer4系がAnaconda3 4.2.0で動かない件

Chainer Python Windows

4/17にChainer 4.0.0がリリースされましたが、Anaconda3 4.2.0では以下のエラーがでて動かなくなっていました。 >>> import chainer Traceback (most recent call last): File "<stdin>", line 1, in <module> File "C:\Anaconda3\lib\site-packages\chainer\__init__.py", </module></stdin>…

2018-03-27

将棋AIの進捗その16(マルチGPU)

CUDA Chainer GPU cuDNN コンピュータ将棋 dlshogi

将棋AIをChainerを使用した実装からcuDNNを使用した実装に変更できたので、マルチGPUでの性能を測定した。 Chainerを使用した場合 Python経由でChainerを使用しているPythonのGIL機構によってマルチスレッドの性能に制限がある。 Chainerを使用した場合の、…

2018-03-27

将棋AIの進捗その15(cuDNNを使用)

CUDA DeepLearning Chainer dlshogi コンピュータ将棋

モデルの学習にディープラーニングフレームワークのChainerを使用していますが、対局時にChainerで推論を行うと、Python経由で呼び出すためマルチGPUで動かす際、Python経由だとGILによってマルチスレッドの性能が出なくなる。また、実行環境にPythonが必要…

2018-03-25

Chainerで学習したモデルを使ってcuDNNで推論する(マルチGPU)

C++ CUDA Chainer DeepLearning cuDNN

前回実装した、Chainerで学習したモデルを使用してcuDNNで推論するコードを、マルチGPUで並列に動作するようにした。cuDNNをマルチスレッドで、スレッドに別々のGPUを割り当てて使用する場合、それぞれのスレッドでcudaSetDevice()を呼び出し、GPU IDを指定…

2018-03-24

Chainerで学習したモデルを使ってcuDNNで推論する(ResNet)

C++ CUDA Chainer DeepLearning cuDNN

前回実装した、Chainerで学習したモデルを使用してcuDNNで推論するコードを、Residual Network(ResNet)構成にした。推論時には、テンソルの加算を行うだけで特に難しいことはない。ネットワーク定義(Chainer) ResNetは1ブロックのみで、ブロック内の畳み込…

2018-03-24

Chainerで学習したモデルを使ってcuDNNで推論する(dropout)

C++ CUDA Chainer DeepLearning cuDNN

前回実装した、Chainerで学習したモデルを使用してcuDNNで推論するコードに、dropoutを追加した。dropoutは学習時のみ処理を行うため、推論時には何もしなくてよい。つまり、推論のネットワーク定義にはdropoutは必要ない。学習用ネットワーク定義学習用…

2018-03-24

Chainerで学習したモデルを使ってcuDNNで推論する(BatchNormalization)

C++ CUDA Chainer cuDNN

前回実装した、Chainerで学習したモデルを使用してcuDNNで推論するコードに、BatchNormalizationを追加した。BatchNormalizationも、cuDNNにAPIが用意されているため、簡単に使用できる。ネットワーク定義(Chainer) まず、Chainerで学習するモデルにBatchNo…

2018-03-24

Chainerで学習したモデルを使ってcuDNNで推論する(時間計測)

C++ Chainer CUDA cuDNN DeepLearning

昨日の日記の続きです。C++のコードでcuDNNを直接使用して推論を行った場合と、Chainerを使用して推論を行った場合の実行時間の比較を行った。測定条件 MNISTのtest set images(1000画像)のすべてを推論するのに要する時間を測定ミニバッチサイズは、100 …

2018-03-24

Chainerで学習したモデルを使ってcuDNNで推論する

C++ cuDNN Chainer

ディープラーニングを使ったモデルを学習する際、ディープラーニングフレームワークを使うと使わないとでは生産性に大きな差がある。多少のオーバーヘッドは許容して、ディープラーニングフレームワークを使う方がトータルでメリットがあると思う。しかし、…

2018-02-25

将棋AIの進捗その12(自己対局のマルチGPU対応)

Chainer DeepLearning コンピュータ将棋

自己対局のプログラムをマルチGPUに対応させました。処理方式は、対局プログラムのマルチGPU対応とほとんど同じです。マルチGPU対応により局面生成の速度がどれくらいあがるか測定しました。測定条件シングルGPUは、TitanV 1枚。200スレッドで対局。マル…

2018-02-18

ChainerでマルチGPUを試す

GPU Chainer CUDA DeepLearning

GPUが2枚になったので、ChainerでマルチGPUによる学習を試してみた。MNISTサンプルを使って、実行時間を測定した。測定条件 CUDA v9.0 cuDNN 7.0.5 ChainerのGitHubレポジトリのexamples/mnistを使用単体の実行時間はtrain_mnist.pyの実行時間マルチGPUの…

2017-10-28

WindowsにChainer v3+CUDA9+cuDNN7をインストールする

Chainer cuDNN CUDA

Chainer v3(cupy v2)がCUDA9に対応したので、バージョンアップしました。 Chainer v3はcuDNNも最新のバージョン7に対応しているので、cuDNNも7にしました。インストール手順は、以前のバージョンと同様です。chainerをバージョンアップする際は、chainerとcu…

2017-10-25

Chainerで計算グラフの可視化

Chainer

Chainerの計算グラフの可視化機能を使ったことなかったので使ってみた。将棋AIのPolicy networkとValue networkを結合したWide ResNetを可視化してみた。 dotファイル出力 Visualization of Computational Graph — Chainer 7.8.1 documentation このページの…

2017-06-21

WindowsでChainerをGPUを使って動かす(v2.0対応)

Chainer

Windowsで安定して使用できるv1.24を使用していましたが、Chainer v2.0でパフォーマンスが向上するということなので、アップデートしました。v1.24用のコードに一部修正が発生しましたが、軽微な修正で対応できました。環境準備以前の日記を参照してくださ…

2017-05-21

将棋でディープラーニングするその19(報酬に応じた勾配その2)

Chainer DeepLearning コンピュータ将棋

※この記事の内容は誤りがありますので、こちらの日記を参照してください。前回の日記でChainerでミニバッチの要素を1件ずつ処理することで報酬に応じた勾配の計算を実装したが、softmax_cross_entropyのbackwardの処理で、誤差逆の後続に伝えるデルタの値に…

2017-05-21

将棋でディープラーニングするその18(報酬に応じた勾配)

Chainer DeepLearning コンピュータ将棋

前回の日記で、RL policy networkの勾配を求める際に、対数尤度の偏微分に報酬に応じた重み（勝敗の報酬から状態価値を引いた値）を掛ける計算の実装が、Chainerでは難しいということを書いた。Chainerでは損失関数のbackwardを行うと、ミニバッチで1つの勾…

2017-05-03

将棋でディープラーニングするその4(ネットワーク構成の変更)

コンピュータ将棋 DeepLearning Chainer

本日から世界コンピュータ将棋選手権が始まりましたね。一次予選を参加者の方の生放送で見ていました。今回からPonanza Chainer以外にもディープラーニングを取り入れて参加している方がちらほらいるようです。こちらの方のアピール文章に、ネットワーク構…

2017-04-10

将棋でディープラーニングするその3(棋譜から学習)

コンピュータ将棋 DeepLearning Chainer

プロの棋譜を使って前回の日記で作成したニューラルネットワークの学習を行った。棋譜サイトにあった竜王戦の棋譜を使用した。訓練データとテストデータの数は以下の通り。訓練データテストデータ局数 3744 417 局面数 422852 47242 学習には非常に時間が…

2017-04-10

将棋でディープラーニングするその2(ニューラルネットワークの構成)

コンピュータ将棋 DeepLearning Chainer

先日の日記に続き、将棋でのディープラーニングの実装を試す。今回は、ニューラルネットワークの構成を検討する。ネットワーク構成ネットワーク構成は、AlphaGoのネットワーク構成を参考にし、13層の畳み込みニューラルネットワーク(DCNN)とする。位置に…

2017-02-26

リアルタイムにマンガの顔パーツ検出を行ってみた

DeepLearning Chainer dlib 顔器官検出

以前に書いた以下の日記の内容を組み合わせて、リアルタイムにマンガの顔パーツ検出を行ってみました。 dlibでマンガの顔認識をやってみた DCNNによるマンガキャラクターの顔パーツ検出 Surfaceのカメラでリアルタイムに顔器官検出を行うリアルタイムにマン…

2017-02-06

DCNNによるマンガキャラクターの顔パーツ検出(追試)

DeepLearning 機械学習 Chainer

前回の日記では正則化など行わずにRMSpropを使用して学習を行ったが、初期値の変更や正則化やBatch Normalizationなどを行った場合にどうなるか試してみた。初期値の変更 ChainerのConvolution2Dのパラメータの初期値は、デフォルトではHeの初期値で初期化…

2017-02-04

DCNNによるマンガキャラクターの顔パーツ検出

DeepLearning Chainer dlib 機械学習

以前の日記でdlibを使用してマンガのキャラクターの顔パーツ検出を行った。しかし、dlibの方法は、マンガキャラクターには有効ではなく、顔パーツを検出できなかった。そこで、DCNNを使用して顔パーツ検出(顔器官検出)ができるか試してみた。 dlibで実装され…

2016-11-03

WindowsでChainerをGPUを使って動かす(更新)

Chainer CUDA Windows

GPUをGeForce GTX 1080に交換したので、CUDAを8.0にバージョンアップした。CUDA7.5でインストールしたChainerが動かなくなったため、CUDA 8.0に対応させるため、再インストールを行った。基本的に、CUDA7.5のときの手順と同じだが、環境変数INCLUDEの設定が…

2016-07-17

cuDNNでAlphaGoのSL policy networkの順伝播を実装する

AlphaGo C++ Chainer cuDNN

Chainerを使って学習したAlphaGoのSL policy networkのモデルを使用して、C++のプログラムからcuDNNを使用して順伝播を実装してみた。SL policy networkを囲碁のプログラムに組み込んで使おうとすると、PythonとChainerが必要になるのでは実行環境の敷居が高…

2016-07-01

CaffeでSL policy networkを学習

AlphaGo C++ Caffe Chainer

前回の日記で定義した、AlphaGoのSL policy networkをCaffeで学習してみた。以前にChainerを使って学習した結果と速度、精度を比較するため、条件を合わせている。インターネットから入手したプロの棋譜を使用特徴はAlphaGoの論文のExtended Data Table 2…

TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

Chainer

将棋AIの進捗その35(PyTorchに移行)

2値分類で中間の値も学習する（続き）

ビルド済みChainerからソースビルド版に戻す

Python環境をVisual Studio 2017に移行

畳み込み層とBatchNormalizationのレイヤー融合をChainerで試してみた

Chainer4系がAnaconda3 4.2.0で動かない件

将棋AIの進捗その16(マルチGPU)

将棋AIの進捗その15(cuDNNを使用)

Chainerで学習したモデルを使ってcuDNNで推論する(マルチGPU)

Chainerで学習したモデルを使ってcuDNNで推論する(ResNet)

Chainerで学習したモデルを使ってcuDNNで推論する(dropout)

Chainerで学習したモデルを使ってcuDNNで推論する(BatchNormalization)

Chainerで学習したモデルを使ってcuDNNで推論する(時間計測)

Chainerで学習したモデルを使ってcuDNNで推論する

将棋AIの進捗その12(自己対局のマルチGPU対応)

ChainerでマルチGPUを試す

WindowsにChainer v3+CUDA9+cuDNN7をインストールする

Chainerで計算グラフの可視化

WindowsでChainerをGPUを使って動かす(v2.0対応)

将棋でディープラーニングするその19(報酬に応じた勾配その2)

将棋でディープラーニングするその18(報酬に応じた勾配)

将棋でディープラーニングするその4(ネットワーク構成の変更)

将棋でディープラーニングするその3(棋譜から学習)

将棋でディープラーニングするその2(ニューラルネットワークの構成)

リアルタイムにマンガの顔パーツ検出を行ってみた

DCNNによるマンガキャラクターの顔パーツ検出(追試)

DCNNによるマンガキャラクターの顔パーツ検出

WindowsでChainerをGPUを使って動かす(更新)

cuDNNでAlphaGoのSL policy networkの順伝播を実装する

CaffeでSL policy networkを学習