2024-06-01から1日間の記事一覧

2024-06-01

大規模言語モデルで将棋AIを作るその５（Transformerのスクラッチ実装）

前回までは、TransformerをPyTorch標準のnn.TransformerEncoderを使用して実装していた。位置エンコーダに「Relative Position Representations」などを使用しようとした場合、Muliti head self-attentionの計算を変更する必要がある。そのため、Muliti he…

TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

2024-06-01から1日間の記事一覧

大規模言語モデルで将棋AIを作るその５（Transformerのスクラッチ実装）

2024-06-01から1日間の記事一覧

大規模言語モデルで将棋AIを作る その５（Transformerのスクラッチ実装）

大規模言語モデルで将棋AIを作るその５（Transformerのスクラッチ実装）