TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

2019-09-01から1ヶ月間の記事一覧

将棋AIの実験ノート:chain ruleで方策を定義する(続き)

(前回の続き)chain ruleで方策を定義したモデルと、現在のdlshogiの指し手を表現したモデルで、同じ局面を学習させて精度を比較した。elmoで生成した、1000万局面を訓練に、100万局面をテストに使用した。 chain rule 現在のdlshogiの指し手表現 test accu…

将棋AIの実験ノート:chain ruleで方策を定義する

現在dlshogiでは、方策ネットワークの出力は、移動先座標と移動方向(8方向+桂馬2方向+駒打ち7方向)の組み合わせで表現している。 これには、移動元を座標で表すと、分類するクラス数が多くなり精度に悪影響があるため、移動方向として表現することでクラ…

dlshogiのLinuxでのビルド/自己対局の実行方法

dlshogiのビルドや自己対局の実行方法について今まで文章化していなかったので、解説用のJupyter Notebookを作成した。 Google Colabで実行できる。colab.research.google.com dlshogiは学習に初期局面集や評価局面集を使っていたり、メモリを大量に消費する…

cshogiにやねうら王の教師局面の入出力機能追加

cshogiには、やねうら王の教師局面(PackedSfenValue)を読み込む機能を実装していたが、指し手を正しく扱えていなかった。 Twitterで報告いただいたので、対応を行った。教師データそのまま(バイナリ)とテキストに変換したもので局面の読み込みは100%で不一…

C#からLibTorchを使ってMNISTデータセットを学習する

C#からディープラーニングフレームワークを使用する方法について、以前にいくつかの方法を検討した。 gRPCでC#とPythonを連携する - TadaoYamaokaの開発日記 SocketでC#とPythonを連携する - TadaoYamaokaの開発日記 TensorFlowのC#バインディング - TadaoYa…

技術書典7

techbookfest.org本日開催される技術書典7で、「こ12D」で頒布される合同誌「強化学習トレンドまとめ」に寄稿を行いました。 私が寄稿したのは、AlphaStarについての簡単な記事です。私の記事よりも、他の方々の記事の方が見どころが多いです。 最新の強化学…

ML.NETからTensorFlowを使う

前回、C#からTensorFlowが使えるTensorFlow.NETというライブラリを試したが、まだ実装されていない機能があるので、他にTensorFlowをフルで使えるライブラリを探すことにした。TensorFlowSharpが十分な機能が実装されているので、.NET Coreへポーティングす…

TensorFlowのC#バインディング

TensorFlowのC#バインディングとして、検索するとTensorFlowSharpが見つかるが、更新が止まっているようで.NET Coreには対応していない(ビルドすれば可能そう)。 TensorFlow.NET 他のライブラリを探したところ、TensorFlow.NETというライブラリを見つけた…

将棋AIで学ぶディープラーニングのJupyter NotebookをColab上で実行できるようにアップデート

先日、【書籍】将棋AIで学ぶディープラーニングのJupyter Notebookを公開しましたが、Lesserkaiとの対局はローカルPCで将棋所を動かす必要があったため、試すハードルが少し高くなっていました。 そこで、先日USIエンジン同士の対局を実装したcshogiを使って…