2021-05-25から1日間の記事一覧

将棋AIの進捗その57（SWAの修正）

dlshogiの学習では、SWA(Stochastic Weight Averaging)を導入している。今までは、1世代学習するごとに、平均化した重みを出力して、次の世代ではその重みを使用して学習していた。しかし、SWAは通常複数エポックに渡って平均化してから、最後に平均化した…