前回の日記でWindowsにインストールしたDarknetを使ってYOLOv2による物体検出を試してみました。
Darknetの学習済みモデルを使用して、ニコニコ動画の上位にあった動画に対して行ってみました。
こちらの動画です。
キャラクターがだいたいpersonと表示されています。
たまに、dogになったり、birdになったりcowになったりするのはある意味正しい?
検出速度はFPS=55.3でしたので、かなり高速です。
今回使用した学習済みモデルは、VOCという写真のデータセットで学習しているので、アニメ向け特化したモデルを学習すればさらに精度が上がると思われます。