2021-12-11から1日間の記事一覧
先日、CUDAのメモリの非同期転送に対応したことを記事にした。 その際に、マルチストリームに対応することで、転送だけではなく演算処理も並列化できることを書いた。その後、マルチストリームの実装を行い、2GPUでは、初期局面でNPSが36%向上することを確認…
先日、CUDAのメモリの非同期転送に対応したことを記事にした。 その際に、マルチストリームに対応することで、転送だけではなく演算処理も並列化できることを書いた。その後、マルチストリームの実装を行い、2GPUでは、初期局面でNPSが36%向上することを確認…