IT之家讯 4月14日下午消息,微软刚刚发布了一个网页应用CaptionBot,该应用能够读取用户上传的照片,然后为这些照片分别写出字幕,十分有趣,微软承诺不会借此收集用户的隐私。
这类应用并非微软首创,谷歌之前发布过一个图像识别程序,该程序也拥有类似功能。此类应用的工作原理分为两部分:第一部分为图像识别,即识别出图像中主要的人和物以及他们之间的关系;第二部分为语言组织,即使用恰当的语言将识别到的人和物组织起来。通过事先准备的数据库,应用在碰到相似的图像场景时就会调出相应的语言组织方式进行处理。
当然以上应用并不完美,当用户上传一些比较抽象的图片的时候,它们就会犯错,不过有时候看这些机器犯错也是一件乐事。以下为微软CaptionBot地址。
本文来源:不详 作者:佚名