ConvNeXtを試す

ConvNeXtは、ResNetなどの畳み込みニューラルネットワークで構成されるニューラルネットワークで、SwinTransformerなど最先端のVisionTransformer系モデル並みの性能が出せるというモデルである。モデル構成残差ブロックの1層目がカーネルサイズ7x7のDepth…

2022-07-10

arXivのPDF論文をブラウザ上で翻訳して読む

普段英語のページは、ChromeのGoogle翻訳拡張機能を使って、翻訳して読むことが多い。英語をそのまま読むのは英語の勉強にもなるのだが、自分の英語力だと辞書引きながらになって読む速度が遅すぎるので、やはりGoogle翻訳が便利である。しかし、Google翻訳…

2022-07-09

DCGANを試す

ほぼ個人メモです。今更ながら生成系のモデルをあまりさわっていなかったので、PyTorchのDCGANのTutorialを試してみた。 DCGAN Tutorial — PyTorch Tutorials 1.12.0+cu102 documentationWindowsだとチュートリアルのソースがそのままでは動かないので、WSL…

2022-07-07

将棋AIの実験ノート：活性化関数をReLUに変更

dlshogi コンピュータ将棋

以前に、活性化関数を変えると同じデータを学習した場合でも、方策の傾向が変わることを実験で確かめた。現状のdlshogiのモデルでは、活性化関数にSwishを使用していたが、最善手を見つけるのに時間のかかると指摘を受けた以下の局面が、活性化関数をReLUに…

2022-07-03

Learning to Play Minecraft with Video PreTraining (VPT)を読む

強化学習

OpenAIが発表したマインクラフトの操作を学習した「Learning to Play Minecraft with Video PreTraining (VPT)」の論文を読んだ際のメモです。概要請負業者(フリーランス)に依頼して作成した7000時間分のキーボード・マウス操作のラベル付き動画からIDM(逆…

2022-06-28

nnue-pytorchを試すその２

コンピュータ将棋 nnue-pytorch

前回、nnue-pytorchをWindowsとLinuxで動作確認した。今回は、前回説明したqsearchで動く局面を除外した場合としない場合で精度の比較を行った。 qsearch除外の実装 Stockfishのnnue-pytorchの--smart-fen-skippingは、学習の実行時に指し手が駒をとる手と王…

2022-06-24

nnue-pytorchを試す

nnue-pytorch

Stockfishで実装されたNNUEモデルをPyTorchで学習できるnnue-pytorchが、nodchip氏によって将棋のNNUE向けにポーティングされた。 GitHub - nodchip/nnue-pytorch at shogi.2022-05-23dlshogiの知識蒸留を試していることもあり、dlshogiのモデルを教師として…

2022-06-24

dlshogiモデルの20ブロックから15ブロックへの知識蒸留追試３

コンピュータ将棋 dlshogi

前回、知識蒸留を訓練データと教師モデルの損失の加重平均の定数αを0.5として実験を行った。今回は、加重平均の重みを変えた場合、精度がどうなるか測定を行った。測定条件前回同様、20ブロックで生成した9.4千万局面(同一局面を平均化すると7千万局面)を…

2022-06-22

dlshogiモデルの20ブロックから15ブロックへの知識蒸留追試２

コンピュータ将棋 dlshogi

前回、知識蒸留を定義通りKLダイバージェンスを計算して実装したが、交差エントロピーを使用しても勾配は変わらないため、交差エントロピーで実装し直した。交差エントロピーの方がPyTorchで用意されているメソッドが使用でき、実行時間も短くなる。実装 i…

2022-06-22

dlshogiモデルの20ブロックから15ブロックへの知識蒸留追試

コンピュータ将棋 dlshogi

先日実験した20ブロックから15ブロックへの知識蒸留について、どれくらい強くなるか検証した。検証項目同一データを使用して学習した、20ブロックと、知識蒸留あり15ブロックのどちらが強いかを確認する。比較のために、知識蒸留なしで学習した15ブロック…

2022-06-20

WCSC32版dlshogiが公開しているモデルからどれくらい強くなっているか

第32回世界コンピュータ将棋選手権で優勝したdlshogi with HEROZが、第2回世界将棋AI電竜戦エキシビジョンバージョン(公開しているモデル)からどれくらい強くなっているかちゃんと測定していなかったので、測定した。測定条件 dlshogiは2スレッド、1GPU(A10…

2022-06-19

dlshogiモデルの20ブロックから15ブロックへの知識蒸留

コンピュータ将棋 dlshogi

dlshogiでは、10ブロックのモデルから始めて、15ブロック、20ブロックとモデルサイズを大きくしている。ブロックが大きいほど、精度が高くなっており強さにも反映される。第32回世界コンピュータ将棋選手権のdlshogiでは20ブロックのモデルを採用している…

2022-06-18

dlshogiをVisual Studio 2022+CUDA11.6+cuDNN8.4+TensorRT8.4に移行

Visual Studio 2022が去年の11月にリリースされたが、CUDAが対応するまで移行を控えていた。 1月にCUDA 11.6がリリースされてVisual Studio 2022に対応したが、cuDNNとTensorRTがCUDA11.6に対応したバージョンがリリースされていなかったので、移行できずに…

2022-06-12

HRNetによる顔のランドマーク検出

写真からランドマークの座標を検出する方法を調べている。以前に、マンガのキャラクターの顔に対して、畳み込みニューラルネットワークから座標を直接回帰する方法を試したことがあったが、それなりに検出できていた。 DCNNによるマンガキャラクターの顔パー…

2022-05-22

世界コンピュータ将棋選手権でのMulti Ponderのヒット率

dlshogi wcsc32

先日の世界コンピュータ将棋選手権で、dlshogiはMulti Ponderを実装していた。相手番で相手局面を探索するStochastic Ponderという手法と組み合わせることで、追加コストゼロで候補手をN手取得できるため、Multi PonderはMCTSと相性がよいクラスタリング手法…

2022-05-17

将棋AIの実験ノート：Fixup Initialization 続き

dlshogi

以前にBatch Normalizationを使用しないFixup Initializationを試したことがある。その際、Leela Chess Zeroでは、Batch Normalizationの統計情報に関連する問題が報告されていることに言及した。 Pawn promotion issues in T40 · Issue #784 · LeelaChessZe…

2022-05-15

cshogiをGitHub ActionsでビルドしてPyPIに公開する

GitHub Actions cshogi

Pythonの将棋ライブラリcshogiをPyPIで公開しているが、PyPIに公開するまでの手順が多いため、GitHub Actionsを使って自動化を行った。前提 cshogiは、CythonとC++を使用しているため、ビルドが必要になる。 WindowsではVisual Studioが必要になる。 Linux…

2022-05-11

gMLPを試す

ほぼ個人メモです。画像認識のモデルで、畳み込みを使わずMLPのみ同等の精度が出せるというMLP Mixerの発展形であるgMLPを試してみた。 gMLP チャネル方向と、空間方向に分けてMLPを適用する構成は、MLP Mixerと同じだが、Spatial Gating Unit (SGU)という仕…