ReazonSpeech v2, whisper-large v3, nue-asrを比較してみた|松note

今年2024年の2月14日に、日本語音声の文字起こしエンジンReazonSpeechのv2がリリースされました。NVIDIAのNemoを採用し、学習データセットも強化され、Fast Conformerという手法により高速化されたそうです。強そう。 (2024-02-14) ReazonSpeech v2.0: 音声モデルの高速化とコーパスの大幅な拡大 - Reazon Human Inter…