TadaoYamaokaの開発日記

個人開発しているスマホアプリや将棋AIの開発ネタを中心に書いていきます。

WindowsにWhisperをインストールする

先日、OpenAIが公開したオープンソース音声認識ソフトウェアであるWhisperWindowsにインストールする方法について記載する。

Anaconda(Miniconda)のインストール

Anacondaもしくは、Minicondaをダウンロードして、インストールする。
必要に応じて仮想環境を作成して、activateする。

PyTorchインストール

コマンドプロンプトから以下のコマンドでPyTorchをインストールする。

conda install pytorch torchvision torchaudio cudatoolkit=11.6 -c pytorch -c conda-forge

NVIDIAGPUが未搭載のPCの場合は、CPU版をインストールする。

conda install pytorch torchvision torchaudio cpuonly -c pytorch

ffmpegインストール

以下のコマンドでffmpegをインストールする。

conda install ffmpeg -c conda-forge

Whisperインストール

以下のコマンドでWhisperをインストールする。

pip install git+https://github.com/openai/whisper.git

テスト

適当な日本語の音声ファイルで、テストする。

>whisper test.wav --language Japanese
[00:00.000 --> 00:02.560] 音声自動認識ソフトウェアのテストです

まとめ

WindowsにWhisperをインストールする方法について記載した。
比較的簡単にインストールして試すことができる。

Windowsゲームバーの録画機能と組み合わせると、いろいろなケースで便利に使えると思う。