TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

2020-04-14から1日間の記事一覧

TensorRTのパフォーマンス測定

TensorRT コンピュータ将棋 dlshogi

先日試したTensorRTをdlshogiのネットワークの推論で試せるようにしたので、パフォーマンスを測定してみた。バッチサイズを可変にして、プロファイル最適化も行った。測定条件 floodgateの棋譜からサンプリングした10万局面の推論時間を測定する。バッチサ…

Agent57: Outperforming the Atari Human Benchmarkを読むその５

強化学習 Agent57

状態行動価値関数のパラメーター化まず、「ランダムコイン」と呼ばれるミニマリズムグリッドワールド環境に対する状態行動価値関数のパラメーター化の影響を評価する。これは、サイズが15×15の空の部屋で構成され、各エピソードの開始時にコインとエージェ…