TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

2023-07-16から1日間の記事一覧

拡散モデルで将棋の方策を学習する その2

前回の続き。 tadaoyamaoka.hatenablog.com前回訓練損失が下がるところまで確認したが、正解率は0%のままだった。 その後学習を継続し、126,504ステップ時点で、訓練損失と正解率は以下の通りとなった。 学習結果 訓練損失 正解率 floodgateの棋譜に対する、…