Pythonの麻雀ライブラリを作る

麻雀AI

以前より不完全情報のボードゲームで強化学習のアルゴリズムを試したいと思ってる。簡単すぎるゲームやマイナーなゲームでは、開発のモチベーションが続かない気がするので、日本で人気のある麻雀AIを開発したいと考えている。麻雀は、「Lucky J」や「Suphx…

拡散モデルで将棋の方策を学習するその４

拡散モデル将棋AI

前回、マルチGPUで学習できるようにしたので、拡散モデルで将棋の方策を学習してどこまで精度が上がるか確認した。学習条件訓練データ：約14億バッチサイズ：512 学習ステップ：10万ステップ学習率：1e-4 オプティマイザ：AdamW GPU数：2 検証データ：fl…

拡散モデル将棋AI

前回、拡散モデルで将棋の方策を学習できることを確認した。今回は、マルチGPUで学習できるように学習処理をPyTorch Lightningで実装し直す。 LightningCLI LightningCLIを使うと、ハイパーパラメータやオプティマイザの設定をconfigファイルに記述できて便…