2023-07-16から1日間の記事一覧

拡散モデルで将棋の方策を学習するその２

前回の続き。 tadaoyamaoka.hatenablog.com前回訓練損失が下がるところまで確認したが、正解率は0%のままだった。その後学習を継続し、126,504ステップ時点で、訓練損失と正解率は以下の通りとなった。学習結果訓練損失正解率 floodgateの棋譜に対する、…