设为首页
收藏本站
请登录
立即注册
论坛首页
BBS
充值赞助
申请提现
提现排行榜
排行榜
Ranklist
友链申请
搜索
本版
文章
帖子
群组
用户
请
登录
后使用快捷导航
没有账号?
立即注册
友情链接
当前位置:
»
论坛首页
›
YOLO图像识别
›
前言资讯
›
人工智能成失明人群的第二双“眼睛” 提供音频引导服务 ...
收藏
0
回复
人工智能成失明人群的第二双“眼睛” 提供音频引导服务
IP属地:
香港
82
0
脆脆鲨
2023-9-21 21:14:51
|
显示全部楼层
|
阅读模式
【CNMO新闻】科技行业资深人士Sujeeth和Suman Kanuganti想知道他们是否可以利用谷歌眼镜和人工智能为一位视力受损的朋友开发类似OnStar(汽车紧急情况的操作员协助)的服务。这个想法在近日成为了现实,它就是Aira,这是一种利用智能眼镜的人工智能引导服务,它可以为视力受损的人更轻松地导航并执行许多日常任务。Aira联合创始人兼首席技术官Sujeeth Kanuganti表示,该产品可以检测条形码、识别产品、阅读产品标签并提供语音优先体验。
人工智能
通过人工智能支持的平台和智能眼镜,Aira将人们连接到服务代理网络以获得帮助。代理可以看到盲人眼前的东西,几乎可以为任何事情提供帮助。Aira的Horizon智能眼镜具有前向摄像头和音频功能,我们可以通过USB线连接到智能手机以接入GPS连接并连接Aira应用程序,这样就可以引导盲人了。
摄像头可以捕捉用户正面的视频,而Aira的人工智能助手Chloe可以帮助识别图像,例如杂货店里的麦片或处方药瓶上的标签和文字。Chloe还可以在设备上本地处理其他简单任务,例如,它可以使用户获得音频指导的帮助,捕捉支票的图像,然后将其与银行应用程序连接起来,通过智能手机将其存入他们的银行帐户。如果遇到更复杂的任务,你只需点击眼镜或应用程序上的按钮即可使用人工代理服务。代理会通过电话直接与Aira用户通信,提供实时视觉信息和音频支持。
更复杂的图像识别和自然语言处理任务会被发送到Aira的卷积神经网络和循环神经网络中。Aira刚开始使用NVIDIA TITAN V GPU进行培训,现在是使用一系列RTX 2080 Ti GPU进行培训,使其能够开发大量数据的深度神经网络。Sujeeth Kanuganti表示,Aira有一套非常好的标签数据。
许多用于对象识别的模型都是使用来自ImageNet和Instagram的图片,对此,Sujeeth表示,这与Aira的服务代理注释的现实世界的培训没有任何可比性。该创业公司已经积累了300万分钟的服务注释。
Aira的Access服务在许多地方都可以免费提供,包括所有Walgreens、Wegmans和AT&T商店,以及30多个国内和国际的机场,Aira在全美50个州和6个国家提供全天服务。
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
脆脆鲨
管理员
关注
4885
主题
0
粉丝
0
关注
这家伙很懒,什么都没留下!
OCR文字识别工具和文件整合包
2024-8-28
Topaz Video AI v3.4.4 人工智能视频画质增强和修复软件
2024-8-28
VITS_fast_finetune 语音模型一键训练整合包
2024-8-28
Stable Diffusion整合包v4.9发布!解压即用 防爆显存 三分钟入门AI绘画 ☆更新 ☆训练
2024-8-28
Yolo_v8轻量版全套工具及易模块和例子支持CPU CUDA10 11
2024-8-28
发新帖
24小时热帖
Topaz Video AI v3.4.4 人工智能视频画质增
2024-08-28
VITS_fast_finetune 语音模型一键训练整合
2024-08-28
Stable Diffusion整合包v4.9发布!解压即用
2024-08-28
Yolo_v8轻量版全套工具及易模块和例子支持C
2024-08-28
AI再显神通!将大脑信号转为语音 准确率最
2023-09-20
Copyright © 2001-2025
Discuz Team.
Powered by
Discuz!
X3.5
|
网站地图