2023-07-22から1日間の記事一覧

2023-07-22

floodgateの棋譜の詰みの手数

拡散モデルで将棋の方策の学習を試しているが、詰みの手順も学習できるか試したいと考えている。そのために、floodgateの棋譜から詰みの局面を抽出した。また、詰みの手数の統計を調査した。抽出方法詰みの局面かの判定には、「KomoringHeights」v1.0.0…

2023-07-22

Llama2の70Bモデルを4bit量子化して1GPUで実行する方法

個人メモHugging Faceで公開されているLlama2のモデルを使用して、4bit量子化を有効にして、70Bのモデルを1GPU(A100)で推論する方法について記述する。 dockerコンテナ作成 NVIDIAのPyTorchイメージを使用してDockerコンテナを作成する。 ※ホストのドライバ…

TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

2023-07-22から1日間の記事一覧

floodgateの棋譜の詰みの手数

Llama2の70Bモデルを4bit量子化して1GPUで実行する方法