TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

GCTの学習に使用したデータセットとノートブックを公開します

GCTの学習に使用したデータセットと、Google Colabのノートブックを公開します。

colab.research.google.com

データセットについて

データセットには、以下を含みます。

  • floodgateの棋譜からhcpe形式に変換したもの
  • elmo_for_learnで生成したデータ
  • AobaZeroの棋譜をhcpe形式に変換したもの
  • dlshogiの強化学習で生成したデータ
AobaZeroの棋譜について

AobaZeroの山下さんに、変換したファイルの二次配布についてご快諾いただきました。ありがとうございます。
Re: AobaZeroの棋譜の二次配布について | コンピュータ将棋や囲碁の掲示板 | 3708

ノートブックについて

加納さんがGCTのモデルの学習に使用したノートブックです。
加納さんは基本は無料のGoogle Colabを使用して学習を行っています。

公開の目的とか

dlshogiの強化学習のデータセットは、私が2018年から生成を開始したものです。
GPUを継ぎ足しつつ自宅のPCを24時間稼働させて、最終的には3枚のGPUを使って生成しています。
同様のことを新たに始めるにはおそらくハードルが高すぎます。

今回、GCTが学習の工夫でdlshogiよりも結果を残したことは、自分にとっても驚きで、学習やモデルアーキテクチャにまだまだ工夫の余地があることを発見しました。
加納さんからデータとノートブックの公開を行いたいという要望があったのを機に、データを公開し参入のハードルを下げることは意義があることだと考えたので公開することにしました。

データセットとノートブックを使うことで、少なくともGCTのモデルの再現は可能だと思います。
新たな人がコンピュータ将棋の開発に参加して、いっしょに盛り上げていってくれることを期待します。


データのストレージやノートブックはすべて加納さんから提供してもらっています。ありがとうございます。
(公開は私の方から行ってほしいという意向です。)