TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

拡散モデル

拡散モデルで将棋の方策を学習するその４

拡散モデル将棋AI

前回、マルチGPUで学習できるようにしたので、拡散モデルで将棋の方策を学習してどこまで精度が上がるか確認した。学習条件訓練データ：約14億バッチサイズ：512 学習ステップ：10万ステップ学習率：1e-4 オプティマイザ：AdamW GPU数：2 検証データ：fl…

拡散モデルで将棋の方策を学習するその３

拡散モデル将棋AI

前回、拡散モデルで将棋の方策を学習できることを確認した。今回は、マルチGPUで学習できるように学習処理をPyTorch Lightningで実装し直す。 LightningCLI LightningCLIを使うと、ハイパーパラメータやオプティマイザの設定をconfigファイルに記述できて便…

ControlNetの学習を試す

ControlNet 拡散モデル

ControlNetは、Stable Diffusionの出力を、スケッチや深度、ポーズなどで制御する手法で、従来のテキストによる条件付けやImage2Imageでは難しかった制御が可能になる。ControlNetを独自のデータセットで学習をしたいと考えており、まずは公式で用意されてい…