TensorFlowをGPUを有効にしてWindowsでビルドする

※公式からWindowsバイナリが提供されたため、この記事の内容はほとんどの人には不要です。

TensorFlowはビルドツールのBazelがWindowsに対応していないため、Windowsではビルドができなかった。

Bash on Windowsを導入することで、Ubuntuのパッケージをバイナリでインストールすることが可能になったが、Bash on WindowsはGPUに対応していないため、CPUでしか実行できなかった。

ながらくそのような状態だったが、とうとうTensorFlowをWindowsでGPUを有効にしてビルドできるようになった。

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/cmake/README.mdgithub.com

ビルドツールにCMakeを使用してビルドができる。
まだアルファ版と注釈されているが、問題なくビルドしてMNISTのサンプルを実行することができた。

基本的にREADME.mdの通りの手順でビルドできたが、実施した手順を記しておく。

準備

CMakeのインストール

Windows版のCMakeをインストールする。

インストーラ版のcmake-3.6.2-win64-x64.msiを使用してインストールした。

インストール時に環境変数PATHを設定するオプションを有効にしておく。

Gitのインストール

Git for Windowsをインストールする。

SWIGのインストール

SWIGから、swigwin-3.0.10.zipをダウンロードして、適当な場所に解凍する。
解凍した場所を環境変数PATHに追加する。

C:\に解凍した場合は、「C:\swigwin-3.0.10」をPATHに追加する。

Visual Studio 2015のインストール

Visual Studio 2015 Communityをインストールする。

Python 3.5のインストール

Anaconda 4.1.1 (Python 3.5 64-bit)で、Python 3.5をインストールする。

NVidia CUDA Toolkit 8.0のインストール

NVidia CUDA Toolkit 8.0をインストールする。

NVidia CUDNN 5.1のインストール

NVidia CUDNN 5.1をダウンロードして、解凍したファイルをCUDAをインストールしたディレクトリにコピーする。

ビルド

コマンドプロンプト起動

スタートメニューから、「VS2015 x64 Native Tools コマンドプロンプト」を選択して、コマンドプロンプトを起動する。

TensorFlowをGitからダウンロードしてワークディレクトリを作成

適当な作業ディレクトリに移動して、以下のコマンドを実行する。

git clone https://github.com/tensorflow/tensorflow.git
cd tensorflow\tensorflow\contrib\cmake
mkdir build
cd build

ビルドファイル作成

以下のコマンドを実行する。

cmake .. -A x64 -DCMAKE_BUILD_TYPE=Release ^
-DSWIG_EXECUTABLE=C:\swigwin-3.0.10\swig.exe ^
-DPYTHON_EXECUTABLE=C:\Anaconda3\python.exe ^
-DPYTHON_LIBRARIES=C:\Anaconda3\libs\python35.lib ^
-Dtensorflow_ENABLE_GPU=ON ^
-DCUDNN_HOME="%CUDA_PATH%"

※パスの部分は環境に合わせて適切な場所に変更する。

オプションに「-Dtensorflow_ENABLE_GPU=ON」を指定することでGPUが有効になる。

ビルド

以下のコマンドを実行する。

MSBuild /p:Configuration=Release tf_tutorials_example_trainer.vcxproj

ビルドには1時間以上かかった。

Pythonにインストール

以下のコマンドを実行する。

MSBuild /p:Configuration=Release tf_python_build_pip_package.vcxproj

.whlファイルがtf_python\distに作成される。

以下のコマンドで、Pythonにインストールする。

cd tf_python\dist
pip install tensorflow-0.11.0rc1_cmake_experimental-py3-none-any.whl

MNISTサンプル実行

コマンドプロンプトを起動し、TensorFlowをダウンロードした作業ディレクトリに移動し、tensorflow\models\image\mnist\convolutional.pyを実行する。

cd tensorflow\models\image\mnist
python convolutional.py

インストールが成功していれば、以下のような結果が表示される。

I h:\src\tensorflow\tensorflow\stream_executor\dso_loader.cc:125] successfully opened CUDA library cublas64_80.dll locally
I h:\src\tensorflow\tensorflow\stream_executor\dso_loader.cc:125] successfully opened CUDA library cudnn64_5.dll locally
I h:\src\tensorflow\tensorflow\stream_executor\dso_loader.cc:125] successfully opened CUDA library cufft64_80.dll locally
I h:\src\tensorflow\tensorflow\stream_executor\dso_loader.cc:125] successfully opened CUDA library nvcuda.dll locally
I h:\src\tensorflow\tensorflow\stream_executor\dso_loader.cc:125] successfully opened CUDA library curand64_80.dll locally
Successfully downloaded train-images-idx3-ubyte.gz 9912422 bytes.
Successfully downloaded train-labels-idx1-ubyte.gz 28881 bytes.
Successfully downloaded t10k-images-idx3-ubyte.gz 1648877 bytes.
Successfully downloaded t10k-labels-idx1-ubyte.gz 4542 bytes.
Extracting data\train-images-idx3-ubyte.gz
Extracting data\train-labels-idx1-ubyte.gz
Extracting data\t10k-images-idx3-ubyte.gz
Extracting data\t10k-labels-idx1-ubyte.gz
I h:\src\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:944] Found device 0 with properties:
name: GeForce GTX 760
major: 3 minor: 0 memoryClockRate (GHz) 1.0845
pciBusID 0000:01:00.0
Total memory: 2.00GiB
Free memory: 1.65GiB
I h:\src\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:965] DMA: 0
I h:\src\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:975] 0:   Y
I h:\src\tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:1007] Ignoring visible gpu device (device: 0, name: GeForce GTX 760, pci bus id: 0000:01:00.0) with Cuda compute capability 3.0. The minimum required Cuda capability is 3.5.
Initialized!
Step 0 (epoch 0.00), 5.6 ms
Minibatch loss: 8.334, learning rate: 0.010000
Minibatch error: 85.9%
Validation error: 84.6%
Step 100 (epoch 0.12), 120.8 ms
Minibatch loss: 3.254, learning rate: 0.010000
Minibatch error: 6.2%
Validation error: 7.8%

(省略)

Step 8400 (epoch 9.77), 118.3 ms
Minibatch loss: 1.595, learning rate: 0.006302
Minibatch error: 0.0%
Validation error: 0.8%
Step 8500 (epoch 9.89), 118.2 ms
Minibatch loss: 1.619, learning rate: 0.006302
Minibatch error: 0.0%
Validation error: 0.9%
Test error: 0.8%

GPUが、GeForce GTX 760だったため、capabilityが足りずCPUでの実行となってしまった。
TensorFlowをGPUで実行するには、capability 3.5以上が必要である。
capability 3.5以上であれば、WindowsでもGPUで実行できるはずである。
GPUを交換して試してみる予定。

TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

TensorFlowをGPUを有効にしてWindowsでビルドする

準備

CMakeのインストール

Gitのインストール

SWIGのインストール

Visual Studio 2015のインストール

Python 3.5のインストール

NVidia CUDA Toolkit 8.0のインストール

NVidia CUDNN 5.1のインストール

ビルド

コマンドプロンプト起動

TensorFlowをGitからダウンロードしてワークディレクトリを作成

ビルドファイル作成

ビルド

Pythonにインストール

MNISTサンプル実行