リバーシ(オセロ)で深層強化学習その７（Prioritized Experience Replay）

強化学習オセロ PyTorch リバーシ

リバーシ(オセロ)で深層強化学習を試すシリーズ、前回からしばらく空いたが、今回はPrioritized Experience Replayを試す。 Prioritized Experience Replay 強化学習では、サンプルの時間依存の相関を弱めるために、サンプルを乱択する経験再生（experience …

2020-01-04

将棋AIの進捗その35(PyTorchに移行)

dlshogi PyTorch Chainer

年末に新しいCPUが届いたので、正月はPCを組んでいた。同時にフルタワーケースを買ったのだが、GPU3枚だと熱対策をしないと安定動作しなかったので、ドリルで加工してファンを増設したりと正月から働いてしまったorz 安定動作するようになったので、前回記…

2019-12-21

WindowsでPyTorchをC++(Visual C++)で動かす【更新】

LibTorch C++ Visual Studio PyTorch

以前にWindowsでLibTorchをC++から使う方法について記事を書いたが、内容が古くなったので書き直す。基本的な手順は以前と同じだが、リリースビルドとデバッグビルドの使い分けができるようになっている。最新のLibTorch 1.3は、Release用のバイナリと、Debu…

2019-08-15

Windows上でPyTorchを使って強化学習を試す

Windows 強化学習 PyTorch

以前はOpenAI GymはWindowsに対応してなかったが、以下のようにpipからインストールするだけで動くようになっている。 atariも問題なく動く。 pip install gym pip install gym[atari]ただし、env.render()で描画するとウィンドウの位置変更などができないと…

TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

PyTorch

リバーシ(オセロ)で深層強化学習その７（Prioritized Experience Replay）

将棋AIの進捗その35(PyTorchに移行)

WindowsでPyTorchをC++(Visual C++)で動かす【更新】

Windows上でPyTorchを使って強化学習を試す

リバーシ(オセロ)で深層強化学習 その７（Prioritized Experience Replay）

将棋AIの進捗 その35(PyTorchに移行)

WindowsでPyTorchをC++(Visual C++)で動かす【更新】

Windows上でPyTorchを使って強化学習を試す

リバーシ(オセロ)で深層強化学習その７（Prioritized Experience Replay）

将棋AIの進捗その35(PyTorchに移行)