ディープラーニングで人間と同じトーン・スピード・抑揚を再現して自然な音声を出力する「WaveNet」をDeepMindが開発

Googleの人工知能開発部門の「DeepMind」が、状況や感情に応じてトーンや「間」などを使い分けて、まるで人間が話しているかのような自然な音声を出力する技術「WaveNet」を開発しました。すでに英語と中国語で、既存のテキストトゥスピーチ(TTS)技術を圧倒する品質を実現しています。