はじめに近年、Text to Speech（TTS）技術の進歩は著しく、特に昨年12月にアップデートされた Gemini の音声生成能力には目を見張るものがあります。サンプルコードを参考にしつつ試しに実行してみると、単なる文字列の音声化というレベルを超えた、抽象的指示を音声に反映する能力の高さを確認できます。たとえば下記…

AIは俳句を声に出して読めない？：俳句で探るTTSの現在地｜朝日新聞社 メディア研究開発センター

AIは俳句を声に出して読めない？：俳句で探るTTSの現在地｜朝日新聞社メディア研究開発センター