2022-11-01から1ヶ月間の記事一覧

2022-11-26

DeepNash(R-NaD)でクーン・ポーカーを学習する

強化学習 DeepNash R-NaD

DeepMindがArxivで発表したDeepNash(R-NaD)がOpenSpielに実装されたので試してみた。 ※2022年12月にScienceにも掲載されました。 DeepNash(R-NaD) DeepNash(R-NaD)は、不完全情報ゲームで探索なしでナッシュ均衡に収束するモデルフリーの深層強化学習アルゴ…

2022-11-12

将棋AI実験ノート：30ブロックの学習

dlshogi コンピュータ将棋

dlshogiのモデルサイズは、10ブロック192フィルタから初めて、精度が飽和するたびに、15ブロック224フィルタ、20ブロック256フィルタと段階的に大きくしている。参考：将棋でディープラーニングするその48(ResNet) - TadaoYamaokaの開発日記第2回電竜戦T…