拡散モデルで将棋の方策の学習を試しているが、詰みの手順も学習できるか試したいと考えている。 そのために、floodgateの棋譜から詰みの局面を抽出した。 また、詰みの手数の統計を調査した。 抽出方法 詰みの局面かの判定には、「KomoringHeights」v1.0.0…
個人メモHugging Faceで公開されているLlama2のモデルを使用して、4bit量子化を有効にして、70Bのモデルを1GPU(A100)で推論する方法について記述する。 dockerコンテナ作成 NVIDIAのPyTorchイメージを使用してDockerコンテナを作成する。 ※ホストのドライバ…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。