设为首页
收藏本站
请登录
立即注册
论坛首页
BBS
充值赞助
申请提现
提现排行榜
排行榜
Ranklist
友链申请
搜索
本版
文章
帖子
群组
用户
请
登录
后使用快捷导航
没有账号?
立即注册
友情链接
当前位置:
»
论坛首页
›
YOLO图像识别
›
前言资讯
›
WellSaid开发高质量语音技术 让合成的声音更加自然 ...
收藏
0
回复
WellSaid开发高质量语音技术 让合成的声音更加自然
IP属地:
香港
73
0
脆脆鲨
2023-9-22 04:15:56
|
显示全部楼层
|
阅读模式
【CNMO新闻】在过去的几年里,随着神经网络技术对传统手工合成方法的改进,语音合成技术已经取得了一系列重大的进展。但谷歌、苹果和亚马逊似乎不想让他们的语音技术在日常生活中使用。
语音合成
但是WellSaid则希望能让任何人都使用到高质量的合成语音,我们很高兴听到WellSaid进军市场的消息。该公司的联合创始人兼首席执行官马特·霍金和首席技术官迈克尔·彼得罗克表示,目前最基本的问题是现有的系统要依靠大量的人类注释才能保证准确。因此,WellSaid的模型经常会对同一个单词的发音有所不同。
这个问题似乎触及了WellSaid的关键处,他们的模型像深度学习系统一样,考虑了无数的输入并产生了一个输出。但它比其它语音合成系统的容量更大,像节奏和发音这样的东西不是由它的监督者指定的,而是从音频中提取并实时建模的。它在CPU上实时运行,而不是在GPU集群上运行,所以它也可以离线运行。这本身就是一个壮举,因为许多语音合成算法都是非常耗费资源的。重要的是,它所产生的声音能够以一种非常自然的方式表达出来,这是前所未有的。
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
脆脆鲨
管理员
关注
4885
主题
0
粉丝
0
关注
这家伙很懒,什么都没留下!
OCR文字识别工具和文件整合包
2024-8-28
Topaz Video AI v3.4.4 人工智能视频画质增强和修复软件
2024-8-28
VITS_fast_finetune 语音模型一键训练整合包
2024-8-28
Stable Diffusion整合包v4.9发布!解压即用 防爆显存 三分钟入门AI绘画 ☆更新 ☆训练
2024-8-28
Yolo_v8轻量版全套工具及易模块和例子支持CPU CUDA10 11
2024-8-28
发新帖
24小时热帖
Topaz Video AI v3.4.4 人工智能视频画质增
2024-08-28
VITS_fast_finetune 语音模型一键训练整合
2024-08-28
Stable Diffusion整合包v4.9发布!解压即用
2024-08-28
Yolo_v8轻量版全套工具及易模块和例子支持C
2024-08-28
AI再显神通!将大脑信号转为语音 准确率最
2023-09-20
Copyright © 2001-2025
Discuz Team.
Powered by
Discuz!
X3.5
|
网站地图