WellSaid开发高质量语音技术 让合成的声音更加自然
【CNMO新闻】在过去的几年里,随着神经网络技术对传统手工合成方法的改进,语音合成技术已经取得了一系列重大的进展。但谷歌、苹果和亚马逊似乎不想让他们的语音技术在日常生活中使用。https://img.cnmo.com/1615_600x1000/1614792.jpg
语音合成
但是WellSaid则希望能让任何人都使用到高质量的合成语音,我们很高兴听到WellSaid进军市场的消息。该公司的联合创始人兼首席执行官马特·霍金和首席技术官迈克尔·彼得罗克表示,目前最基本的问题是现有的系统要依靠大量的人类注释才能保证准确。因此,WellSaid的模型经常会对同一个单词的发音有所不同。
这个问题似乎触及了WellSaid的关键处,他们的模型像深度学习系统一样,考虑了无数的输入并产生了一个输出。但它比其它语音合成系统的容量更大,像节奏和发音这样的东西不是由它的监督者指定的,而是从音频中提取并实时建模的。它在CPU上实时运行,而不是在GPU集群上运行,所以它也可以离线运行。这本身就是一个壮举,因为许多语音合成算法都是非常耗费资源的。重要的是,它所产生的声音能够以一种非常自然的方式表达出来,这是前所未有的。
页:
[1]