设为首页
收藏本站
请登录
立即注册
论坛首页
BBS
充值赞助
申请提现
提现排行榜
排行榜
Ranklist
友链申请
搜索
本版
文章
帖子
群组
用户
请
登录
后使用快捷导航
没有账号?
立即注册
友情链接
当前位置:
»
论坛首页
›
YOLO图像识别
›
前言资讯
›
微软开发Seeing AI应用 图像转音频盲人可实现“听”图 ...
收藏
0
回复
微软开发Seeing AI应用 图像转音频盲人可实现“听”图
IP属地:
香港
78
0
脆脆鲨
2023-9-22 05:15:54
|
显示全部楼层
|
阅读模式
【CNMO新闻】微软的Seeing AI是一款应用程序,可让盲人和有视力障碍的人将视觉数据转换为音频反馈,并且它还添加了另一个新功能,即用户可以利用触摸来浏览照片中的对象和人物。该功能使用了机器学习技术,特别是在对象和场景识别方面,用户只需要在查看器中拍照或打开照片,然后点击上面的任意位置即可。
微软
Seeing AI负责人Saqib Shaikh在博客文章中写道:“这一新功能让用户可以通过手指触摸屏幕上的图像,就可以获取对象的描述以及它们之间的空间关系。该应用程序甚至可以描述人们的外表,并且预测他们的心情。”
因为该应用程序内置了面部识别技术,用户可以拍摄其朋友的照片,然后听听他们在做什么、在哪里以及图片中是否有狗等等。
但该应用程序现在允许用户点击以查找对象的位置,显然对于理解图片或从之前的图片中进行识别非常重要。一些在整体描述中没有出现的细节也可能会在仔细检查时出现,例如前景中的鲜花或背景中的电影海报。
除此之外,该应用程序现在原生支持iPad,对于那些使用苹果平板电脑作为媒体和交互主要界面的人来说,这肯定是一件非常好的事情。最后,界面有一些改进,因此用户可以根据自己的喜好在应用中订购。
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
脆脆鲨
管理员
关注
4885
主题
0
粉丝
0
关注
这家伙很懒,什么都没留下!
OCR文字识别工具和文件整合包
2024-8-28
Topaz Video AI v3.4.4 人工智能视频画质增强和修复软件
2024-8-28
VITS_fast_finetune 语音模型一键训练整合包
2024-8-28
Stable Diffusion整合包v4.9发布!解压即用 防爆显存 三分钟入门AI绘画 ☆更新 ☆训练
2024-8-28
Yolo_v8轻量版全套工具及易模块和例子支持CPU CUDA10 11
2024-8-28
发新帖
24小时热帖
Topaz Video AI v3.4.4 人工智能视频画质增
2024-08-28
VITS_fast_finetune 语音模型一键训练整合
2024-08-28
Stable Diffusion整合包v4.9发布!解压即用
2024-08-28
Yolo_v8轻量版全套工具及易模块和例子支持C
2024-08-28
AI再显神通!将大脑信号转为语音 准确率最
2023-09-20
Copyright © 2001-2025
Discuz Team.
Powered by
Discuz!
X3.5
|
网站地图