Gemini API でラジオ番組の音声からの文字起こしを試す|npaka

「Gemini API」でラジオ番組の音声からの文字起こしを試したので、まとめました。 1. Gemini 1.5 Pro の 音声データ入力 「Gemini 1.5 Pro」で音声データでの入力が可能になりました。 サポートしているファイル形式は、次のとおりです。 ・MIMEタイプの制限  ・WAV - audio/wav  ・MP3 - audio/mp3  ・AIFF - aud…