dlshogiのPyTorch Lightning対応

dlshogi コンピュータ将棋

dlshogiの学習は、PyTorchを使用して、モデルの訓練処理を独自に実装していた。マルチGPUによる分散学習に対応させようと考えているが、独自に実装するより、PyTorch lightningに対応させた方が実装が楽になるため、dlshogiをPyTorch Lightningに対応させた…

2024-02-18

【論文】Bridging the Human–AI Knowledge Gap: Concept Discovery and Transfer in AlphaZeroを読む

AlphaZero

DeepMindがarXivで発表した、AlphaZeroからチェスの新しい概念を抽出して人間のパフォーマンス向上に使えるようにする方法について述べた「Bridging the Human-AI Knowledge Gap: Concept Discovery and Transfer in AlphaZero」を読んだ際のメモ。概要 Alp…

2024-02-12

【論文】Grandmaster-Level Chess Without Searchを読む

Transformer

DeepmindがarXivで発表したチェスで探索なしでグランドマスターレベルに達したTransformerベースモデルに関する論文「Grandmaster-Level Chess Without Search」を読んだ際のメモ。概要標準的なTransformerのデコーダを教師あり学習することで探索なしでチ…

2024-02-11

PokéLLMonの論文を読む

LLM

LLMを使用してポケモンバトルをプレイするPokéLLMonの論文を読んだ際のメモ。概要 LLMを使用して、ポケモンバトルをプレイするエージェントを作成する。現在の状態をテキストとして与え、行動を生成する以前のターンの結果をテキストとして、コンテキスト…

TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

2024-02-01から1ヶ月間の記事一覧

dlshogiのPyTorch Lightning対応

【論文】Bridging the Human–AI Knowledge Gap: Concept Discovery and Transfer in AlphaZeroを読む

【論文】Grandmaster-Level Chess Without Searchを読む

PokéLLMonの論文を読む