RareJob Tech Blog
id:rarejobyuma
レッスン音声の文字起こし&話者分離
こんにちは、Yumaです。 最近、オンライン英会話レッスンの録音(約30分)を文字起こしし、話者ごとに書き分けるシステムを見直しました。以前はPyannoteで話者分離(ダイアライゼーション)を行い、その結果をWhisper Turboで文字起こしするパイプラインをGoogle Cloud Run (GPUあり) で動かしていました。ところが、GPU…