谷歌AI官方博客最新博文中向我们介绍了一项实验性质的新系统--Translatotron,它能够直接将语音翻译成为语音,中间不再需要任何文本。在博文中写道:“Translatotron是首个能够直接将一种语言的语音翻译成为另一种语言语音的端到端模型。”
谷歌表示当前的翻译系统分为三个步骤:自动语音识别,将语音转换为文本;机器翻译,将文本转换为另一种语言;最后是文本转语音(TTS)合成,也就是将翻译好的文本生成语音。在这三个步骤衍生出了Google Translate等服务,不过这家科技巨头希望通过一个模型就实现语音的翻译,而不再需要借助文本这个中间步骤。
Google AI软件工程师Ye Jia和Ron Weiss表示:“该系统名为Translatotron,这个系统避免了将任务分成不同的阶段。”谷歌表示这意味着更快的翻译速度和更少的转译错误。该系统使用频谱图作为输入并生成频谱图,同样依赖于神经声码器和扬声器编码器,这意味着系统在翻译后保留说话者的声音特征。
继续阅读与本文标签相同的文章
上一篇 :
如何在Magento中创建一个简单的模块?
下一篇 :
PHP实现多个构造函数的最佳方法
-
速度提升一倍,无需实例掩码预测即可实现全景分割
2026-05-15栏目: 教程
-
中芯绍兴8英寸产线最新进展:超150台设备搬入工厂
2026-05-15栏目: 教程
-
一秒更换Word中的几十个箭头,2大妙招,让你比别人快 10 倍!
2026-05-15栏目: 教程
-
女机器人一上架就卖完,外观像极真人,关键还带“生育”功能
2026-05-15栏目: 教程
-
2022年企业工业互联网边缘计算规模将达五成
2026-05-15栏目: 教程
