【論文】Voyager: An Open-Ended Embodied Agent with Large Language Models

LLM

GPT-4を使って、マインクラフトで初めてダイアモンドを獲得したLLMを利用したエージェントであるVoyagerの論文を読んだ際のメモ。概要 LLM(GPT-4)を利用して、マインクラフトで「できるだけ多くの多様なものを発見し、できるだけ多くの多様なタスクを達成し…

PyTorchのFXグラフモードで量子化認識トレーニングを試す

ディープラーニングのモデルを推論する際、通常GPUが必要である。しかし、GPUがない場合でも、モデルのパラメータを浮動小数点から整数へと変換する手法を使うことで、CPUだけでも推論処理を高速に行うことが可能である。この手法を量子化と呼ぶ。 PyTorchの…

LLM

LLMをプロンプトやチェーンよりも効果的に制御することができるguidanceを試してみた。LangChainを使うと、複数のプロンプトを組み合わせて、前のプロンプトの回答を次のプロンプトに渡すような処理ができる。そのような処理をするには、Pythonでプログラミ…

dlshogi

今年の世界コンピュータ将棋選手権で、dlshogiチームはA100x8のサーバを9台使用してMultiPonderによるクラスタ構成を採用していた。 9台使用していても、Ponderにヒットした1台しか実際の指し手には影響せず、多くのケースではMultiPonderなしの通常のPonder…

5/3～5/5に開催された第33回世界コンピュータ将棋選手権に参加しました。HEROZチームとして、「dlshogi with HEROZ」というプログラム名でエントリしました。大会の概要世界コンピュータ将棋選手権は、1990年より毎年開催されている歴史のあるコンピュータ…