AIは俳句を声に出して読めない?:俳句で探るTTSの現在地|朝日新聞社 メディア研究開発センター

はじめに 近年、Text to Speech(TTS)技術の進歩は著しく、特に昨年12月にアップデートされた Gemini の音声生成能力には目を見張るものがあります。 サンプルコードを参考にしつつ試しに実行してみると、単なる文字列の音声化というレベルを超えた、抽象的指示を音声に反映する能力の高さを確認できます。 たとえば下記…