TadaoYamaokaの日記

山岡忠夫Homeで公開しているプログラムの開発ネタを中心に書いていきます。

2018-10-08から1日間の記事一覧

GeForce RTX 2080 TiでTensorCoreを使う(その2 FP16対応)

前回、GeForce RTX 2080 TiのTensorCoreによる推論の速度を、cuDNN 7.2で追加されたCUDNN_TENSOR_OP_MATH_ALLOW_CONVERSIONオプションを使用して、内部的にFP32からFP16に変化させることで測定を行った。今回は入力から出力までを、FP16にして測定してみた。…