先日、OpenAIが公開したオープンソースの音声認識ソフトウェアであるWhisperをWindowsにインストールする方法について記載する。
PyTorchインストール
コマンドプロンプトから以下のコマンドでPyTorchをインストールする。
conda install pytorch torchvision torchaudio cudatoolkit=11.6 -c pytorch -c conda-forge
NVIDIAのGPUが未搭載のPCの場合は、CPU版をインストールする。
conda install pytorch torchvision torchaudio cpuonly -c pytorch
Whisperインストール
以下のコマンドでWhisperをインストールする。
pip install git+https://github.com/openai/whisper.git
テスト
適当な日本語の音声ファイルで、テストする。
>whisper test.wav --language Japanese [00:00.000 --> 00:02.560] 音声自動認識ソフトウェアのテストです