【dlshogi】dlshogiモデルでNNUEの評価値を付け替えるその７

dlshogi コンピュータ将棋

前回、dlshogiの最新モデルで、自己対局して生成した教師データを、同じモデルで推論した結果に付け替えることで、モデルサイズによらず精度が上がる傾向があることを確かめた。今回は、dlshogiの最新モデルではなく、既存の教師データを使い、そのデータを…

【dlshogi】dlshogiモデルでNNUEの評価値を付け替えるその６

dlshogi コンピュータ将棋

前回、dlshogiのモデルの自己対局で生成した教師データの方策、価値、勝敗を、同一モデルで推論した結果に付け替えた場合、精度が上がることを観測した。自己対局で探索した教師データより、探索なしで推論した結果の方が精度が上がるのは予想外の結果だっ…

dlshogi コンピュータ将棋

前回、NNUE系のtanuki-で生成した教師データを使用して、dlshogiのモデルで方策と評価値、勝敗を付け替えた場合に、dlshogiの推論結果で付け替えた方が精度が上がることが確認できた。今回は、dlshogiの最新モデルの自己対局で生成したデータに対して、同一…

dlshogi コンピュータ将棋

前回、NNUE系で生成した教師データの方策と評価値に加えて、勝敗もdlshogiのモデルで推論した結果に付け替えた方が精度が上がることを確かめた。前回までは、2020年にNNUE系で生成した教師データを使用したが、nodchip氏が公開している最近のNNUEで生成した…

前回、NNUE系で生成した教師データの方策と評価値をdlshogiのモデルで推論した結果に付け替えることで、方策と評価値ともに精度が上がることを確認した。今回は、学習の損失の勝敗項についても、モデルで推論した価値に付け替えることで、精度が上がるか試し…

dlshogi コンピュータ将棋

前回、NNUE系で生成した教師データの評価値をdlshogiのモデルで推論した評価値に付け替えることを試した。今回は、方策についてもモデルの推論結果に付け替えることを検討する。方策の付け替え NNUE系で生成した教師データは、最善手のみが記録されているが…

前回試した軽量価値ネットワークをStockfishの探索に組み込むことを検討している。最終的には、dlshogiのMCTSベースの探索とStockfishベースの探索を組み合わせることを構想しているが、まずは、単体で動作するStockfishベースのプログラムを作りたい。実…