第2回世界将棋AI 電竜戦結果報告

dlshogi GCT 電竜戦

11/20(土)、21(日)に開催された第2回世界将棋AI電竜戦に参加しました。チームdlshogiとして、dlshogi、GCT電竜、python-dlshogi2という3つのソフトでエントリしました。大会の結果 GCT電竜が優勝、dlshogiが準優勝、python-dlshogi2がＣ級優勝という結果に…

2021-11-20

第2回世界将棋AI 電竜戦 1日目結果報告

dlshogi 電竜戦コンピュータ将棋

本日、第2回世界将棋AI 電竜戦の予選リーグがありました。予選リーグの結果全46チーム参加で、上位10チームが明日のA級リーグで総当たりで優勝を争います。 11位～28位はB級リーグ、それ以外はC級リーグになります。私はdlshogiと、チームとしてGCT電竜と…

2021-11-01

Windows11+WSL2+Dockerでdlshogiを動かす続き

dlshogi WSL2 Docker

昨日、Windows11でCUDA on WSLを試したが、なぜかWindows上でdlshogiのNPSが低下する問題が発生した。WindowsのCUDAのバージョンが古かったため、新しいバージョンで試してみた。 CUDAインストール TensorRTの最新版(8.2.0.6)に対応した、CUDAの最新版(11.4)…

2021-11-01

Windows11+WSL2+Dockerでdlshogiを動かす

dlshogi Windows11 WSL2 Docker

学習用のPCをWindows11にアップグレードしたので、CUDA on WSLを試してみた。ドライバインストール CUDA on WSLに対応したドライバをインストールする。 GPU in Windows Subsystem for Linux (WSL) | NVIDIA Developer ※2021/11/1 追記 CUDA 11.4に付属する…

2021-10-31

dlshogiのmateの読み筋表示続き

dlshogi

昨日の記事で、dlshogiを詰みの読み筋表示に対応させたことを書いた。その際、王手の合法手に不成を生成していないことで、手順が10手以上長くなる局面があることがわかった。探索速度が低下しないのであれば、不成を生成することを検討したい。そこで、不…

2021-10-31

dlshogiのmateの読み筋表示

dlshogi

dlshogiは、モンテカルロ木探索とは別に、詰み専用のアルゴリズム(df-pn)で長手数の詰み探索を行っている。 df-pnで詰みが見つかった場合、すぐにその手を返している。df-pnは、詰みがあるかどうかを見つけるアルゴリズムのため、見つかる手順が最短手順とは…

2021-09-28

将棋AIの実験ノート：活性化関数Mishを試す

dlshogi コンピュータ将棋

以前にdlshogiのモデルで活性化関数をReLUからSwishにした場合の比較を行った。今回は、活性化関数Mishを試した。 Mish Mishは、で表される活性化関数である。論文によると、6層CNNのCIFAR-10の訓練で、Swishの正解率を上回ると報告されている。 [1908.0868…

2021-09-25

dlshogiの学習時の自己対局での先手勝率

dlshogi コンピュータ将棋

少し前にdlshogiの先手勝率について調べた。今回は、dlshogiの学習時の自己対局での先手勝率について調べた。開始局面現在、dlshogiの自己対局は、floodgateの16手目までの出現頻度が99パーセンタイル以上の局面を初期局面集として、そこからさらに16手MC…

2021-09-13

水匠4とdlshogiのNPSの比較

コンピュータ将棋 dlshogi

ディープラーニング系の将棋AIは、従来の将棋AIと比べてNPSが低くても強いという特徴がある。 NPSがどれくらい違うのか質問を受けることがあるので、測定を行った。 NPSのカウント方法の違いやねうら王(元はStockfishのソース)のNPSは、探索中にdo_moveを行…

2021-08-26

dlshogiのOpenCL対応その1

dlshogi OpenCL

dlshogiをOpenCLに対応させたいと思っている。現在のdlhsogiはTensorRTを使用しているため、再配布の制限があり、環境構築が大変になっている。 OpenCLは、必要なdllを同梱すれば環境構築が不要になるので利用者にメリットがある。OpenCLのコードを一から作…

2021-08-24

やねうら王バグのdlshogiへの影響

dlshogi

先日の水匠とdlshogiの長時間マッチの第1局で、水匠側にバグが発生するというハプニングがあった。原因などの詳細は、やねうら王ブログを参照して欲しい。先日の電竜戦、長時間マッチで現れたやねうら王のバグについて | やねうら王公式サイトここで、こ…

2021-08-23

dlshogiの先手勝率

dlshogi

dlshogiの先手勝率について質問されることがあるので、計測してみた。持ち時間1分1秒加算で、dlshogi(dr2_exhi)の自己対局と、dlshogiと水匠4の対局で計測した。対局条件が持ち時間だと、ある程度手が揺らぐため完全に同じ手順になるのは防ぐことができる。…

2021-08-18

ONNXファイルのパース処理

dlshogi ONNX

dlshogiは現在TensorRTを使用しているが、TensorRTは再配布できないなどライセンスが厳しいのと、環境構築が大変なため、OpenCLに対応させたいと思っている。OpenCLでも、NVIDIAのGPUのTensorCoreをPTXインラインアセンブリという方法で使用することができる…

2021-08-17

dlshogi(第2回世界将棋AI電竜戦エキシビジョンバージョン)のWindows版ビルド済みファイル公開

dlshogi

dlshogi(第2回世界将棋AI電竜戦エキシビジョンバージョン)のWindows版ビルド済みファイルを公開します。ダウンロード Release 第2回世界将棋AI電竜戦エキシビジョンバージョン · TadaoYamaoka/DeepLearningShogi · GitHub のAssetsからダウンロードしてくだ…

2021-08-14

電竜戦長時間マッチ「水匠 vs dlshogi」

dlshogi 電竜戦

明日8/15(日) 17:00から、私の開発した「dlshogi」と電竜戦TSEC優勝ソフト「水匠」との長時間マッチを行います。対局の様子は、YouTubeとニコニコ動画で生配信されます。先手、後手入れ替えて計2局行います。第1局は、阿部健治郎七段と佐々木勇気七段のダ…

2021-08-11

AWS inf1 インスタンスで推論を行うその3

dlshogi AWS

前回、neuronコアを複数使用して推論を行うことを試した。今回は、推論速度の測定を行った。参考にしたいのは、dlshogiでの推論速度であるため、C++のdlshogiの推論部分に組み込んで、どれくらいのNPSがでるのかを確認した。 C++での推論の実装方法 C++でne…

2021-08-04

AWS inf1 インスタンスで推論を行うその2

dlshogi AWS

前回AWS inf1 インスタンスでdlshogiのモデルの推論ができることを確認したが、今回はマルチGPUで推論できるかを確かめてみた。マルチGPUにするには、Inferentia チップが複数あるAWS inf1 インスタンス(inf1.6xlargeとか)が必要と思っていたが、よく調べる…

2021-08-02

AWS inf1 インスタンスで推論を行う

dlshogi AWS

dlshogiをAWS inf1 インスタンスで動かせないか試している。 AWS inf1 インスタンスは、推論に特化したAWS Inferentia チップが搭載されている。現在のdlshogiは、TensorRTを使用して推論を行っているため、NvidiaのGPUで動かすことが前提になっている。 onn…

2021-07-18

第2回電竜戦TSEC 結果報告

dlshogi コンピュータ将棋電竜戦

7/17~18にかけて実施された第2回電竜戦TSECにdlshogiというソフトで参加しました。チームとしてはGCT電竜でも参加しています。第2回世界将棋AI 電竜戦TSEC -中継サイトファイナルリーグとB級リーグに分かれて実施されて、7/3に行われた予選で上位2チーム…

2021-06-07

将棋AI実験ノート：ブロック数とフィルタ数とSE有無の比較

dlshogi コンピュータ選手権

同一データを学習した際に、ResNetのブロック数とフィルタ数とSE(Squeeze-and-Excitation)有無により、精度、強さがどう変わるかを比較した。比較対象 ResNet 10ブロック、192フィルタ ResNet 15ブロック、224フィルタ ResNet 20ブロック、256フィルタ上の…

2021-05-31

dlshogiをPyPIに登録

dlshogi コンピュータ将棋

今までdlshogiの学習を行うために、python環境を作成して、boostをインストールして、C++からPythonモジュール(cppshogi)をビルドしてという手順が必要だったが、pipコマンドでインストールできるようにPyPIに登録した。 pip install dlshogiアップデートの…

2021-05-25

将棋AIの進捗その57（SWAの修正）

dlshogi コンピュータ将棋

dlshogiの学習では、SWA(Stochastic Weight Averaging)を導入している。今までは、1世代学習するごとに、平均化した重みを出力して、次の世代ではその重みを使用して学習していた。しかし、SWAは通常複数エポックに渡って平均化してから、最後に平均化した…

2021-05-23

将棋AI実験ノート：自己対局時のノードの再利用

dlshogi コンピュータ将棋

以前に、dlshogiの自己対局でノードの再利用を行うと、テスト損失が上昇する（過学習する）という問題が起きたことを書いた。方策の分布を学習するようにしたため、問題も起きにくくなっている可能性があるので、ノードの再利用（ルートノードはクリア）を行…

2021-05-14

将棋AI実験ノート：方策の学習に温度パラメータを導入

dlshogi コンピュータ将棋

以前にdlshogiで方策の分布を学習できるようにしたが、方策の分布を学習したモデルで対局すると、指し手のみを学習したモデルよりも弱くなるという問題が起きている。温度パラメータの調整である程度強くできたが、指し手のみを学習したモデルには及んでい…

2021-05-09

dlshogiの学習部のリファクタリングと各手法の精度比較

dlshogi コンピュータ将棋

世界コンピュータ選手権も終わったので、feature/hcpe3やfeature/hcpe3_averageに分かれていたブランチをmasterに統合して整理した。リファクタリング重複局面の平均化や、評価値の補正をオプション(それぞれ--use_averate、--use_evalfix)で有効/無効化で…

2021-05-06

GCTの学習に使用したデータセットを公開

GCT dlshogi

dlshogi with GCTのWCSC31バージョンのモデルの学習に使用したデータセットを公開します。https://drive.google.com/drive/u/3/folders/1Lkh4HL0tMx9p3NNbHue9lvh_HOSBGxhv加納さんのご厚意により、Googleドライブの無料枠を大幅に上回る容量を提供してもら…

2021-05-06

将棋AI実験ノート：自己対局の評価値の補正

dlshogi コンピュータ将棋

Discordで、評価値と勝率を変換する際の以下のシグモイド関数の係数aは、dlshogiはelmo_for_learnの自己対局から求めた756.0864962951762という値を使用しているが、floodgateの棋譜などを学習する場合はもっと低い値になるので補正すべきというやり取りがあ…

2021-05-05

dlshogi with GCT（WCSC31バージョン）のWindows版ビルド済みファイル公開

dlshogi GCT wcsc31

dlshogi with GCT（WCSC31バージョン）のWindows版ビルド済みファイルを公開します。ダウンロード Release 第31回世界コンピュータ将棋選手権バージョン · TadaoYamaoka/DeepLearningShogi · GitHubNVIDIA GPUに対応したTensorRT版と、NVIDIA GPU非搭載のWi…

2021-05-04

第31回世界コンピュータ将棋選手権結果報告

dlshogi GCT WCSC31

「dlshogi with GCT」として、第31回世界コンピュータ将棋選手権に参加しました。本日は予選2日目で、dlshogiはシードのため2日目からの参加でした。上位8チームが決勝進出になります。結果は、30チーム中14位と決勝進出ならず残念な結果でした。昨年の電…

2021-04-17

将棋AIの実験ノート：重複局面の平均を学習

dlshogi コンピュータ将棋

dlshogiの自己対局で生成したデータを学習すると、方策損失がNaNになるというissueをもらった。自己対局棋譜を用いるとPolicyのlossがNaNになる · Issue #44 · TadaoYamaoka/DeepLearningShogi · GitHub 原因実際にデータをもらって、調査したところ、強化…

TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

dlshogi

第2回世界将棋AI 電竜戦結果報告

第2回世界将棋AI 電竜戦 1日目結果報告

Windows11+WSL2+Dockerでdlshogiを動かす続き

Windows11+WSL2+Dockerでdlshogiを動かす

dlshogiのmateの読み筋表示続き

dlshogiのmateの読み筋表示

将棋AIの実験ノート：活性化関数Mishを試す

dlshogiの学習時の自己対局での先手勝率

水匠4とdlshogiのNPSの比較

dlshogiのOpenCL対応その1

やねうら王バグのdlshogiへの影響

dlshogiの先手勝率

ONNXファイルのパース処理

dlshogi(第2回世界将棋AI電竜戦エキシビジョンバージョン)のWindows版ビルド済みファイル公開

電竜戦長時間マッチ「水匠 vs dlshogi」

AWS inf1 インスタンスで推論を行うその3

AWS inf1 インスタンスで推論を行うその2

AWS inf1 インスタンスで推論を行う

第2回電竜戦TSEC 結果報告

将棋AI実験ノート：ブロック数とフィルタ数とSE有無の比較

dlshogiをPyPIに登録

将棋AIの進捗その57（SWAの修正）

将棋AI実験ノート：自己対局時のノードの再利用

将棋AI実験ノート：方策の学習に温度パラメータを導入

dlshogiの学習部のリファクタリングと各手法の精度比較

GCTの学習に使用したデータセットを公開

将棋AI実験ノート：自己対局の評価値の補正

dlshogi with GCT（WCSC31バージョン）のWindows版ビルド済みファイル公開

第31回世界コンピュータ将棋選手権結果報告

将棋AIの実験ノート：重複局面の平均を学習