2025-01-01から1ヶ月間の記事一覧
前回、NNUE系のtanuki-で生成した教師データを使用して、dlshogiのモデルで方策と評価値、勝敗を付け替えた場合に、dlshogiの推論結果で付け替えた方が精度が上がることが確認できた。今回は、dlshogiの最新モデルの自己対局で生成したデータに対して、同一…
前回、NNUE系で生成した教師データの方策と評価値に加えて、勝敗もdlshogiのモデルで推論した結果に付け替えた方が精度が上がることを確かめた。前回までは、2020年にNNUE系で生成した教師データを使用したが、nodchip氏が公開している最近のNNUEで生成した…
前回、NNUE系で生成した教師データの方策と評価値をdlshogiのモデルで推論した結果に付け替えることで、方策と評価値ともに精度が上がることを確認した。今回は、学習の損失の勝敗項についても、モデルで推論した価値に付け替えることで、精度が上がるか試し…
前回、NNUE系で生成した教師データの評価値をdlshogiのモデルで推論した評価値に付け替えることを試した。今回は、方策についてもモデルの推論結果に付け替えることを検討する。 方策の付け替え NNUE系で生成した教師データは、最善手のみが記録されているが…
前回試した軽量価値ネットワークをStockfishの探索に組み込むことを検討している。 最終的には、dlshogiのMCTSベースの探索とStockfishベースの探索を組み合わせることを構想しているが、まずは、単体で動作するStockfishベースのプログラムを作りたい。 実…