前回、WhisperのモデルをONNXにする方法について記述した。Whisperのモデルは、単体では音声認識はできず、音声をメルスペクトログラムにする前処理と、トークンをデコードして文字列にする後処理が必要になる。今回は、前処理と後処理をC#で実装する方法について記述する。音声認識の流れ以下のような流れで音声をテキ…

TadaoYamaokaの開発日記

WhisperのモデルをONNXにするその２

TadaoYamaokaの開発日記

WhisperのモデルをONNXにする その２

WhisperのモデルをONNXにするその２