TadaoYamaokaの開発日記
id:TadaoYamaoka
WhisperのモデルをONNXにする その2
前回、WhisperのモデルをONNXにする方法について記述した。Whisperのモデルは、単体では音声認識はできず、音声をメルスペクトログラムにする前処理と、トークンをデコードして文字列にする後処理が必要になる。 今回は、前処理と後処理をC#で実装する方法について記述する。 音声認識の流れ 以下のような流れで音声をテキ…