【読書ノート】カスタマーサクセス――サブスクリプション時代に求められる「顧客の成功」10の原則

読書ノート

書籍「カスタマーサクセス――サブスクリプション時代に求められる「顧客の成功」10の原則」を読んだので内容をまとめる。以下の内容は、ほとんどClaude3 Opusを使用して作成している。序文序文の要約：カスタマーサクセスとは、顧客の成功を最優先し、そ…

2024-05-11

dlshogiのPyTorch Lightning対応その５(DDPの課題)

dlshogi コンピュータ将棋

PyTorch Lightningに対応させたdlshogiで、並列(DDP)で学習するといくつか問題が発生したため、対処した。保存したモデルが壊れる on_train_endで、モデルを保存していたが、マルチGPUで実行している場合、並列処理用の各プロセスでon_train_endが実行され…

2024-05-06

第34回世界コンピュータ将棋選手権結果報告

世界コンピュータ将棋選手権 dlshogi

5/3～5/5に開催された第34回世界コンピュータ将棋選手権にHEROZチームとして、「dlshogi with HEROZ」というプログラム名で参加しました。大会の概要世界コンピュータ将棋選手権は、1990年より毎年開催されている歴史のあるコンピュータ将棋の大会です。 …

2024-04-16

【読書ノート】効果検証入門〜正しい比較のための因果推論／計量経済学の基礎

読書ノート

書籍「効果検証入門〜正しい比較のための因果推論／計量経済学の基礎」を読んだので内容をまとめる。以下の内容は、ほとんどClaude3 Opusを使用して作成している。嘘っぱちの効果とそれを見抜けないデータ分析要約効果検証は、ビジネスにおいて重要な意…

2024-04-12

【読書ノート】ALL for SaaS SaaS立ち上げのすべて

読書ノート

書籍「ALL for SaaS SaaS立ち上げのすべて」を読んだので内容をまとめる。以下の内容は、ほとんどClaude3 Opusを使用して作成している。 Part 1 SaaSを取り巻く環境 Chapter 1 SaaSの概要要約 SaaSは「Software as a Service」の略で、ソフトウェアをクラ…

2024-03-29

【読書ノート】Lean Software Development: An Agile Toolkit

読書ノート

書籍「Lean Software Development: An Agile Toolkit: An Agile Toolkit」を読んだので内容をまとめる。以下の内容は、ほとんどClaude3 Opusを使用して作成している。 Introduction 「リーンソフトウェア開発」は、ソフトウェア開発のリーダーのための思考…

2024-03-24

大規模言語モデルで将棋AIを作る

先日、dlshogiをPyTorch Lightningに対応させてマルチGPUで学習できるようにした。これは、より大規模なモデルで将棋を学習するための布石でもある。Transformerを使ったLLMで使われている技術を将棋に応用することを計画している。「Deep Learning Shogi…

2024-03-23

【読書ノート】Kaggleに挑む深層学習プログラミングの極意

読書ノート

書籍「Kaggleに挑む深層学習プログラミングの極意」を読んだので内容をまとめる。以下の内容は、ほとんどClaude3 Opusを使用して作成している。はじめに本書は、画像やテキストを用いるKaggleコンテストでの著者らの知見を体系的にまとめたものである。第…

2024-03-22

【読書ノート】GitLabに学ぶ世界最先端のリモート組織のつくりかた

読書ノート

書籍「GitLabに学ぶ世界最先端のリモート組織のつくりかた」を読んだので内容をまとめる。以下の内容は、ほとんどClaude3 Opusを使用して作成している。はじめに本書は、リモート組織を実現するためのノウハウをGitLabのHandbookを基に解説し、誰もが再…

2024-03-22

【読書ノート】機械学習エンジニアのためのTransformers

読書ノート

書籍「機械学習エンジニアのためのTransformers」を読んだので内容をまとめる。以下の内容は、ほとんどClaude3 Opusを使用して作成している。第1章入門Transformers いる。さらに、Transformer系モデルのGPTとBERTが紹介され、自然言語処理の分類、固有表…

2024-03-20

【読書ノート】スーパーインテリジェンス超絶AIと人類の命運

読書ノート

書籍「スーパーインテリジェンス超絶AIと人類の命運」（ニック・ボストロム）を読んだので内容をまとめる。以下の内容は、ほとんどClaude3 Opusを使用して作成している。第１章人工知能の発展、現在の能力人類の脳の進化により、言語、技術、複雑な社…

2024-03-20

【読書ノート】System Design Interview : Mastering Basic Introduction to System Analysis and Design

読書ノート

書籍「System Design Interview : Mastering Basic Introduction to System Analysis and Design」を読んだので内容をまとめる。以下の内容は、ほとんどClaude3 Opusを使用して作成している。 CHAPTERごとの要約 CHAPTER 1: SCALE FROM ZERO TO MILLIONS OF…

2024-03-20

【読書ノート】プロダクトマネジメントのすべて事業戦略・IT開発・UXデザイン・マーケティングからチーム・組織運営まで

読書ノート

書籍「プロダクトマネジメントのすべて事業戦略・IT開発・UXデザイン・マーケティングからチーム・組織運営まで」を読んだので内容をまとめる。以下の内容は、ほとんどClaude3 Opusを使用して作成している。 PART Ⅰ プロダクトの成功 Chapter 1 プロダクト…

2024-03-19

【読書ノート】私たちはどう学んでいるのか――創発から見る認知の変化

読書ノート

書籍「私たちはどう学んでいるのか――創発から見る認知の変化」を読んだので内容をまとめる。以下の内容は、ほとんどClaude3 Opusを使用して作成している。要約はじめに人は日々の生活の中でさまざまな経験を重ね、認知的変化を遂げる。本書ではこうした…

2024-03-19

【読書ノート】SCRUMMASTER THE BOOK 優れたスクラムマスターになるための極意――メタスキル、学習、心理、リーダーシップ

読書ノート

書籍「SCRUMMASTER THE BOOK 優れたスクラムマスターになるための極意――メタスキル、学習、心理、リーダーシップ」を読んだので内容をまとめる。以下の内容は、ほとんどClaude3 Opusを使用して作成している。要約 CHAPTER1 スクラムマスターの役割と責務 …

2024-03-18

【読書ノート】科学的根拠に基づく最高の勉強法

読書ノート

書籍「科学的根拠に基づく最高の勉強法」を読んだので内容をまとめる。以下の内容は、ほとんどClaude3 Opusを使用して作成している。要約はじめに本書は、科学的に根拠のある効果の高い勉強法について、心理学や脳科学の研究によって得られた客観的な証…

2024-03-17

【読書ノート】Clean Architecture　達人に学ぶソフトウェアの構造と設計

読書

書籍「Clean Architecture 達人に学ぶソフトウェアの構造と設計」を読んだので、内容をまとめた。以下の内容は、ほとんどClaude3 Opusを使用して作成している。まえがき・第I部イントロダクションまえがきソフトウェアシステムの構造を決定するルールは…

2024-03-17

【読書ノート】最適輸送の理論とアルゴリズム

読書

Stable Diffusion 3は、Flow Matchingが使用されており、Flow Matchingは最適輸送とも関連するということなので、積んでおいた「最適輸送の理論とアルゴリズム」を読んだ。数式をほとんど読み飛ばして読んだまとめである。以下の内容は、ほとんどClaude3 Op…

2024-03-16

【読書ノート】エリック・エヴァンスのドメイン駆動設計

書評読書

最近、ソフトウェア開発を行っているので、ソフトウェア設計に関する勉強をしている。「エリック・エヴァンスのドメイン駆動設計」を読んだので、内容をまとめた。以下の内容は、ほとんどClaude3 Opusで書いている。概要第1部ドメインモデルを機能させる…

2024-03-12

dlshogiのPyTorch Lightning対応その５(Warm-upに対応したスケジューラ)

dlshogi コンピュータ将棋

大規模なモデルの学習に効果があるとされる学習率スケジューリングの手法にWarm-upがある。しかし、Pytorchの標準のスケジューラには、Warm-upに対応したスケジューラが提供されていない。PyTorch Lightning Boltsには、Warm-upに対応したCosineAnnealingLR…

2024-03-07

dlshogiモデルの枝刈りを試す

dlshogi コンピュータ将棋

前回、深層強化学習において、モデルの枝刈りによりスケーリングが可能であることを示した論文を紹介した。dlshogiの強化学習でもモデルの枝刈りが効果があるか試したいと考えているが、まずはモデルの枝刈りのみを行って、精度と探索速度にどう影響するかを…

2024-03-05

【論文】In deep reinforcement learning, a pruned network is a good networkを読む

コンピュータ将棋

DeepMindがarXiv上で発表した、深層強化学習のモデルを段階的な枝刈りすることでモデルサイズのスケーリングが可能になることを示した「In deep reinforcement learning, a pruned network is a good network」を読んだ際のメモ。概要深層強化学習はモデル…

2024-03-04

dlshogiのPyTorch Lightning対応その４(8GPUで学習)

dlshogi コンピュータ将棋

前回、dlshogiをPyTorch Lightningを使用した並列学習に対応させた、8GPUでどれくらい学習が速くなるか試した。条件 30ブロック384フィルタのモデル訓練データ: 35,289,182局面エポック数: 2 バッチサイズ: 4096 オプティマイザ: AdamW 学習率: 1e-4 (1ep…

2024-03-02

dlshogiのPyTorch Lightning対応その３(DDP)

dlshogi コンピュータ将棋

PyTorch Lightningに対応できたので、DistributedDataParallel によるマルチGPU学習を試してみた。前回未対応だった、勾配クリッピングはconfig.yamにgradient_clip_valを記述するだけで対応できた。また、モデルのエクスポートもon_train_end()で実装した…

2024-03-02

dlshogiのPyTorch Lightning対応その２(EMA)

dlshogi コンピュータ将棋

前回、dlshogiのPyTorch Lightning対応の基本部分を実装した。今回は、EMAを実装する。 EMA EMAは、Exponential Moving Averageの略で、重みの指数移動平均をとり平準化する方法である。dlshogiでは、SWAと呼んでいたが、SWAで使われるスケジューラは使用し…

2024-02-28

dlshogiのPyTorch Lightning対応

dlshogi コンピュータ将棋

dlshogiの学習は、PyTorchを使用して、モデルの訓練処理を独自に実装していた。マルチGPUによる分散学習に対応させようと考えているが、独自に実装するより、PyTorch lightningに対応させた方が実装が楽になるため、dlshogiをPyTorch Lightningに対応させた…

2024-02-18

【論文】Bridging the Human–AI Knowledge Gap: Concept Discovery and Transfer in AlphaZeroを読む

AlphaZero

DeepMindがarXivで発表した、AlphaZeroからチェスの新しい概念を抽出して人間のパフォーマンス向上に使えるようにする方法について述べた「Bridging the Human-AI Knowledge Gap: Concept Discovery and Transfer in AlphaZero」を読んだ際のメモ。概要 Alp…

2024-02-12

【論文】Grandmaster-Level Chess Without Searchを読む

Transformer

DeepmindがarXivで発表したチェスで探索なしでグランドマスターレベルに達したTransformerベースモデルに関する論文「Grandmaster-Level Chess Without Search」を読んだ際のメモ。概要標準的なTransformerのデコーダを教師あり学習することで探索なしでチ…

2024-02-11

PokéLLMonの論文を読む

LLM

LLMを使用してポケモンバトルをプレイするPokéLLMonの論文を読んだ際のメモ。概要 LLMを使用して、ポケモンバトルをプレイするエージェントを作成する。現在の状態をテキストとして与え、行動を生成する以前のターンの結果をテキストとして、コンテキスト…

2024-01-15

麻雀AIを深層強化学習で作るその１１(学習処理)

麻雀AI

前回、自己対局で特徴量を作成する処理を実装した。今回は、自己対局で生成したデータを読み込んで学習する処理を実装した。データ読み込み自己対局プログラムでzlibで圧縮したデータをPythonのzlibで解凍し、Numpyのndarrayとして読み込む。 C++の構造体…

TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

【読書ノート】カスタマーサクセス――サブスクリプション時代に求められる「顧客の成功」10の原則

dlshogiのPyTorch Lightning対応その５(DDPの課題)

第34回世界コンピュータ将棋選手権結果報告

【読書ノート】効果検証入門〜正しい比較のための因果推論／計量経済学の基礎

【読書ノート】ALL for SaaS SaaS立ち上げのすべて

【読書ノート】Lean Software Development: An Agile Toolkit

大規模言語モデルで将棋AIを作る

【読書ノート】Kaggleに挑む深層学習プログラミングの極意

【読書ノート】GitLabに学ぶ世界最先端のリモート組織のつくりかた

【読書ノート】機械学習エンジニアのためのTransformers

【読書ノート】スーパーインテリジェンス超絶AIと人類の命運

【読書ノート】System Design Interview : Mastering Basic Introduction to System Analysis and Design

【読書ノート】プロダクトマネジメントのすべて事業戦略・IT開発・UXデザイン・マーケティングからチーム・組織運営まで

【読書ノート】私たちはどう学んでいるのか――創発から見る認知の変化

【読書ノート】SCRUMMASTER THE BOOK 優れたスクラムマスターになるための極意――メタスキル、学習、心理、リーダーシップ

【読書ノート】科学的根拠に基づく最高の勉強法

【読書ノート】Clean Architecture　達人に学ぶソフトウェアの構造と設計

【読書ノート】最適輸送の理論とアルゴリズム

【読書ノート】エリック・エヴァンスのドメイン駆動設計

dlshogiのPyTorch Lightning対応その５(Warm-upに対応したスケジューラ)

dlshogiモデルの枝刈りを試す

【論文】In deep reinforcement learning, a pruned network is a good networkを読む

dlshogiのPyTorch Lightning対応その４(8GPUで学習)

dlshogiのPyTorch Lightning対応その３(DDP)

dlshogiのPyTorch Lightning対応その２(EMA)

dlshogiのPyTorch Lightning対応

【論文】Bridging the Human–AI Knowledge Gap: Concept Discovery and Transfer in AlphaZeroを読む

【論文】Grandmaster-Level Chess Without Searchを読む

PokéLLMonの論文を読む

麻雀AIを深層強化学習で作るその１１(学習処理)