dlshogiでMagic Bitboardを有効にする

dlshogi コンピュータ将棋

やねうら王が飛車と角の利きに、PEXTの代わりにMagic Bitboardを使用することで、Threadripperで高速化できたとのことなので、dlshogiでも高速化できるか試してみた。dlshogiは合法手生成にAperyのソースを使用しており、AperyはMagic Bitboardを実装してい…

2020-08-01

C#からPythonへポインタ渡しする

C# Python for .NET Python

以前に、Python for .NETを使用することで、C#とPythonを同一プロセスで動かせることを紹介した。C#からPythonへの呼び出し時に、引数と戻り値は、自動的にマーシャリングが行われる。ここで、C#の型からPythonのネイティブな型に変換されるのは、スカラ型…

2020-07-23

【将棋AI】N駒関係をMulti-Head Self-Attentionで学習する続き3

コンピュータ将棋

前回、入力特徴量の与え方でMulti-Head Self-Attentionの精度を向上できることを確認したが、DCNN(Resnet 10ブロック)に比べて精度がでないことが分かった。今回は、Multi-Head Self-Attentionの出力をDCNNに入力して、Multi-Head Self-AttentionとDCNNを組…

2020-07-19

【将棋AI】N駒関係をMulti-Head Self-Attentionで学習する続き2

コンピュータ将棋

前回に引き続き、将棋AIへのMulti-Head Self-Attentionの適用を試してみた。前回は、dlshogiと同じ入力特徴量を使用したが、Multi-Head Self-Attentionに合わせて以下の変更を行った。各位置の特徴ベクトルに位置の情報を入力する持ち駒の枚数の特徴ベクト…

2020-07-16

【将棋AI】N駒関係をMulti-Head Self-Attentionで学習する続き

コンピュータ将棋

前回考察した将棋AIへのMulti-Head Self-Attentionの適用を試してみた。実装を簡単するために、dlshogiで使用している入力特徴量と出力をそのまま使用した。入力特徴量各駒の配置持ち駒の枚数駒の種類ごとの利きマスごとの効き数 ※王手の特徴量は除いた…

2020-07-12

【将棋AI】N駒関係をMulti-Head Self-Attentionで学習する

コンピュータ将棋

こないだ参加したハースストーンのAIコンペの関連論文を読んでいて、個人的に興味深い論文があった。Helping AI to Play Hearthstone using Neural Networksこの論文では、ハースストーンのゲーム状態からニューラルネットワークを使って勝率を予測する方法…

2020-06-30

ハースストーンのAIコンペ

ハースストーン MCTS

不完全情報ゲームのAIの論文を調べていて、たまたまハースストーンのAIコンペがあることを知ったので、試したいこともあったのでさくっとMCTSのプログラムを作って提出してみた。ハースストーンは、相手の手札や山札は見ることができない不完全情報ゲームで…

2020-06-16

C#のオブジェクトをダンプする

C#

C#のオブジェクトに格納されている値を調べたいときに、VS Codeなどのデバッガを使えば確認することができるが、オブジェクトの階層が深い場合は、テキストファイルにダンプして確認したくなる。 ObjectDumper.NET 方法がないか調べたところ、「ObjectDumper…

2020-06-07

ONNX Runtimeを使ってみるその3(DirectML)

ONNX Runtime

ONNX RuntimeでDirectMLを使ってdlshogiのモデルの推論を行い、処理時間を比較してみた。DirectMLを使えばAMDのGPUでも推論が実行できるようになる。 DirectMLプロバイダの使用 NuGetからビルド済みバイナリが取得できる。 Microsoft.ML.OnnxRuntime.DirectM…

2020-06-06

ONNX Runtimeを使ってみるその2(性能測定)

ONNX Runtime

先日、ONNX Runtimeを使って、MNISTの推論を試した。今回は、dlshogiのResnet 10ブロック、192フィルタのモデルを使って、GPUで実行した場合の速度と、CPUで実行した場合の速度を比較した。測定条件 GPUでのONNXの推論にはTensorRT(FP16)を使用する。 CPUの…

2020-06-02

C#からPythonを呼び出す

Python C#

以前にC#からPythonのディープラーニングフレームワークを呼び出すいくつかの方法を記事にした。 gRPCでC#とPythonを連携する - TadaoYamaokaの開発日記 SocketでC#とPythonを連携する - TadaoYamaokaの開発日記 TensorFlowのC#バインディング - TadaoYamaok…

2020-05-31

dlshogiの学習則

dlshogi

dlshogiを改造して遊びたい方のために、dlshogiの学習則についてちゃんと書いてなかったので書いておく。主に、学習部のソースtrain_rl_policy_with_value_using_hcpe_bootstrap.pyの解説になっている。 AlphaZeroの学習則 AlphaZeroの学習則は、となってい…

2020-05-27

Agent57: Outperforming the Atari Human Benchmarkを読むその１５

Agent57

付録H. 実験結果 H.1. Atari 10：アブレーションのスコア表 H.2. Backpropウィンドウの長さの比較図12. 難易度の高い10ゲームのセットでの、Backpropウィンドウの長さが短い場合と長い場合のパフォーマンスの比較 H.3. アイデンティティとh変換の組み合わせ…

2020-05-26

ONNX Runtimeを使ってみる

dlshogiはCUDAに対応したNvidiaのGPUが必須になっているが、AMDのGPUやCPUのみでも動かせるようにしたいと思っている。Microsoftがオープンソースで公開しているONNX Runtimeを使うと、様々なデバイスでONNXモデルの推論を行うことができる。 TensorRT対応で…

2020-05-25

Agent57: Outperforming the Atari Human Benchmarkを読むその１４

Agent57

付録G. ハイパーパラメータ G.1. との値セットの選択の間の直感は次のとおりです。については、非常に活用的である方策と探索的である方策を奨励したいので、図11(a)に示すようにシグモイドを選択する。については、活用方策（の値が小さい）には長期的な…

2020-05-22

Agent57: Outperforming the Atari Human Benchmarkを読むその１３

Agent57

付録F. ネットワークアーキテクチャ図9. Agent57のスケッチ図10. Agent57の詳細

2020-05-22

Agent57: Outperforming the Atari Human Benchmarkを読むその１２

Agent57

付録E. 分散設定の実装の詳細リプレイバッファー固定長の遷移のシーケンスと優先度を格納する。遷移はの形式である。このような遷移はタイムステップとも呼ばれ、シーケンスHの長さはトレース長と呼ばれる。さらに、リプレイバッファー内の隣接するシー…

2020-05-19

Agent57: Outperforming the Atari Human Benchmarkを読むその１１

Agent57

付録D. マルチアームバンディット形式この節では、マルチアームバンディット（MAB）パラダイム、上限信頼限界（UCB）アルゴリズム、およびスライディングウィンドウUCBアルゴリズムについて簡潔に説明する。より完全な説明と分析については、Garivier & Mo…

2020-05-18

Agent57: Outperforming the Atari Human Benchmarkを読むその１０

Agent57

付録C.リトレースおよび変換されたリトレースリトレースは、評価または制御のための方策オフのRLアルゴリズムである。評価設定の目標は、行動方策から引き出された軌跡からターゲット方策の状態行動価値関数を推定することである。制御設定では、を近似す…

2020-05-13

C++の再現性の低いバグを解析する

C++

先日、dlshogiをfloodgateでテストした際に、goコマンドに対して結果を返さずタイムアップするという事象が発生した。再現性が低く、全く同じ局面を手動でコンソールからコマンドを入力して何度も探索させても再現しなかった。スレッドプールの処理に問題が…

2020-05-10

将棋AIの進捗その48（NPS改善）

dlshogi コンピュータ将棋

ノード再利用の方式見直しを行った後、強くなっているかApery(WCSC28)と1手3秒100局で確認を行った。結果、勝利は62%で、変更前は69%だったので、強くなっていないことがわかった。考察理由としては、以下が考えられる。 Ponderなしの秒読みではノード再利…

2020-05-10

将棋AIの進捗その48（PV表示対応）

dlshogi コンピュータ将棋

Qhapaqさんからプルリクをいただいたので、dlshogiをPV表示に対応しました。プルリクにはなかったのですが、USIオプション「PV_Interval」を追加しました。「0」にするとPV表示なし、0以上にすると、設定したms間隔でPVを表示します。masterブランチに反映…

2020-05-08

将棋AIの進捗その47（Linuxのマルチスレッド排他処理）

dlshogi コンピュータ将棋

昨日の記事で、dlshogiのゲーム木の管理をロックレス方式に見直しを行った。Windowsでは、ノード単位の排他制御をmutexを用いずに、atomic_flag (TAS機能)で実現することで10%NPSが向上したが、Linuxで測定すると800NPSくらいしかでないという悲惨な結果にな…

2020-05-07

将棋AIの進捗その46（ノード再利用の見直し）

dlshogi コンピュータ将棋

世界コンピュータ将棋オンライン大会でノード再利用の処理に問題があることがわかったので、見直した。先日の記事で、Leela Chess Zeroのゲーム木の管理方法を調査して、合流を処理しないでC++のヒープ管理を利用してツリー状にノードを管理していることが分…

2020-05-05

Leela Chess Zeroのノード再利用の方法

dlshogi コンピュータ将棋

世界コンピュータ将棋オンライン大会で、dlshogiのノード再利用の方法に問題があることが明らかになったので、見直すことにする。現在のハッシュ管理 dlshogiのハッシュ管理は、Ray+Rnのゾブリストハッシュの実装を参考にしていた。 Ray+Rnのノード再利用の…

2020-05-05

dlshogiの環境構築手順

世界コンピュータ将棋オンライン大会でdlshogiライブラリを使用していたGCTは、AWSのWindows Serverで環境構築されていました。構築手順を共有いただいたので、参考にしてください。AWSでのGPU環境の構築手順について · Issue #12 · TadaoYamaoka/DeepLearni…

2020-05-05

dlshogi（wcsoc2020）のWindows版ビルド済みファイル公開

dlshogi wcsoc2020

dlshogiの世界コンピュータ将棋オンライン大会バージョンのWindows版ビルド済みファイルを公開します。Release 世界コンピュータ将棋オンライン大会バージョン · TadaoYamaoka/DeepLearningShogi · GitHub実行には、CUDA 10.2に対応したGPUが必要です。イン…

2020-05-04

世界コンピュータ将棋オンライン大会結果報告

wcsoc2020 dlshogi

昨日、本日、世界コンピュータ将棋オンライン大会が開催されました。 dlshogiはシードのため2日目からの参加でした。結果は、4勝4敗で、2日目に進んだ28チームの内13位でした。 floodgateでのテストからR4000くらいと見積もっていたので、順当な結果だと思い…

2020-05-03

将棋AIの進捗その45(大会直前の性能改善)

dlshogi コンピュータ将棋

いよいよ本日から世界コンピュータ将棋オンライン大会が始まりました。概要 http://www2.computer-shogi.org/wcso1.html 参加チーム https://www.apply.computer-shogi.org/wcsoc/team.html 棋譜中継 http://live4.computer-shogi.org/wcso1/ 特設サイト htt…

2020-05-02

将棋AIの進捗その44(大会直前の調整)

dlshogi コンピュータ将棋

世界コンピュータ将棋オンライン大会はいよいよ明日から開催です。今日は、直前に簡単に変更できる部分をいくつか調整を行っていました。探索延長の条件変更今までは、ルートの訪問数が1番目の手と2番目の手の差が1.2倍未満の場合に、1.5倍探索を延長して…

TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

2020-01-01から1年間の記事一覧

dlshogiでMagic Bitboardを有効にする

C#からPythonへポインタ渡しする

【将棋AI】N駒関係をMulti-Head Self-Attentionで学習する続き3

【将棋AI】N駒関係をMulti-Head Self-Attentionで学習する続き2

【将棋AI】N駒関係をMulti-Head Self-Attentionで学習する続き

【将棋AI】N駒関係をMulti-Head Self-Attentionで学習する

ハースストーンのAIコンペ

C#のオブジェクトをダンプする

ONNX Runtimeを使ってみるその3(DirectML)

ONNX Runtimeを使ってみるその2(性能測定)

C#からPythonを呼び出す

dlshogiの学習則

Agent57: Outperforming the Atari Human Benchmarkを読むその１５

ONNX Runtimeを使ってみる

Agent57: Outperforming the Atari Human Benchmarkを読むその１４

Agent57: Outperforming the Atari Human Benchmarkを読むその１３

Agent57: Outperforming the Atari Human Benchmarkを読むその１２

Agent57: Outperforming the Atari Human Benchmarkを読むその１１

Agent57: Outperforming the Atari Human Benchmarkを読むその１０

C++の再現性の低いバグを解析する

将棋AIの進捗その48（NPS改善）

将棋AIの進捗その48（PV表示対応）

将棋AIの進捗その47（Linuxのマルチスレッド排他処理）

将棋AIの進捗その46（ノード再利用の見直し）

Leela Chess Zeroのノード再利用の方法

dlshogiの環境構築手順

dlshogi（wcsoc2020）のWindows版ビルド済みファイル公開

世界コンピュータ将棋オンライン大会結果報告

将棋AIの進捗その45(大会直前の性能改善)

将棋AIの進捗その44(大会直前の調整)