2023-09-12から1日間の記事一覧

拡散モデルで将棋の方策を学習するその４

拡散モデル将棋AI

前回、マルチGPUで学習できるようにしたので、拡散モデルで将棋の方策を学習してどこまで精度が上がるか確認した。学習条件訓練データ：約14億バッチサイズ：512 学習ステップ：10万ステップ学習率：1e-4 オプティマイザ：AdamW GPU数：2 検証データ：fl…