微软开发Seeing AI应用图像转音频盲人可实现“听”图

脆脆鲨 · 2023-9-22 05:15:54

　　【CNMO新闻】微软的Seeing AI是一款应用程序，可让盲人和有视力障碍的人将视觉数据转换为音频反馈，并且它还添加了另一个新功能，即用户可以利用触摸来浏览照片中的对象和人物。该功能使用了机器学习技术，特别是在对象和场景识别方面，用户只需要在查看器中拍照或打开照片，然后点击上面的任意位置即可。

微软

　　Seeing AI负责人Saqib Shaikh在博客文章中写道：“这一新功能让用户可以通过手指触摸屏幕上的图像，就可以获取对象的描述以及它们之间的空间关系。该应用程序甚至可以描述人们的外表，并且预测他们的心情。”
　　因为该应用程序内置了面部识别技术，用户可以拍摄其朋友的照片，然后听听他们在做什么、在哪里以及图片中是否有狗等等。
　　但该应用程序现在允许用户点击以查找对象的位置，显然对于理解图片或从之前的图片中进行识别非常重要。一些在整体描述中没有出现的细节也可能会在仔细检查时出现，例如前景中的鲜花或背景中的电影海报。
　　除此之外，该应用程序现在原生支持iPad，对于那些使用苹果平板电脑作为媒体和交互主要界面的人来说，这肯定是一件非常好的事情。最后，界面有一些改进，因此用户可以根据自己的喜好在应用中订购。

微软开发Seeing AI应用 图像转音频盲人可实现“听”图

微软开发Seeing AI应用图像转音频盲人可实现“听”图