2025-01-10から1日間の記事一覧
前回、NNUE系で生成した教師データの方策と評価値をdlshogiのモデルで推論した結果に付け替えることで、方策と評価値ともに精度が上がることを確認した。今回は、学習の損失の勝敗項についても、モデルで推論した価値に付け替えることで、精度が上がるか試し…
前回、NNUE系で生成した教師データの方策と評価値をdlshogiのモデルで推論した結果に付け替えることで、方策と評価値ともに精度が上がることを確認した。今回は、学習の損失の勝敗項についても、モデルで推論した価値に付け替えることで、精度が上がるか試し…