天下网吧 >> 网吧系统 >> 系统动态 >> 正文

微软识花:精细物体识别是怎么做到的

2016-10-1不详佚名

十一,各个公园,商场等城市的各个角落都摆上了给祖国母亲庆生的鲜花,妆点着节日的气氛。天安门广场上的巨型花坛,也吸引了来自全国各地游客的驻足和拍照。那么,这些花坛上都有哪些花呢?这时候,你可以默默掏出“微软识花”应用,深藏功与名。

微软亚洲研究院推出最新款智能识别应用——一位可以随身携带的植物专家“微软识花”,可以帮你破解花的秘密。拿出手机,打开App,拍张照片,一键识别,随手解救好奇心。微软识花应用所能识别的花卉覆盖了中国的绝大多数花卉。微软识花的打开方式应该是这样的……

首先,打开微软识花应用,现场拍摄或从手机图库里打开一张花儿的照片,将花朵移动至指定位置。然后,应用会自动识别出花朵的名称和类型,并显示出匹配度,告诉你花的基本特征、药用价值等。以上动作完全可以在不联网的条件下实现!这就意味着,当你在流量捉襟见肘的情况下,照样可以用没有网的手机识别出新奇的花卉品种。

微软识花:精细物体识别是怎么做到的

400种花卉一键识别

知道是什么花还不过瘾?别急,“微软识花”有一个独特的“花语”功能。赏花要懂花语,花语是人们赋予花的一种象征,可以用来表达人的某种感情与愿望。不同的花有不同的花语,在没有了解花语时就乱送别人鲜花,结果只会引来别人的误会。花语虽无声,但此时无声胜有声。对于每一种花,系统都会附上一段娓娓道来的花语。比如“六道木”的花语是“对你的念想沿六条直线自下而上,终于在顶端开出了最好看的花”,是不是恰似你现在的心情呢?一键分享到朋友圈,用最适合你心情的曼妙花语来表达你此刻的心意吧!

微软识花:精细物体识别是怎么做到的

大家在使用时或许还能发现藏在应用里的两个彩蛋。

微软识花应用带有一个专门的花儿搜索包,将400种园艺花卉收录在系统中,按字母顺序排序。也许有的花你只听说过名字,没见过“真容”,那么这款应用就可以帮你提前见识一下。只有没听过,没有搜不到。400种花基本涵盖了我国城市绿化和公园常见的花卉品种,想看哪种花都可以搜索到。

另外,如果你玩腻了识花,微软识花还有另一个有趣的功能等待你开掘:那就是对其他常见的日常物体进行识别。拿件衣服、摆个文具来测测这款应用的“智商”,听起来也是挺有趣的事呢!对于常用物体的识别采用了微软亚洲研究院最先进的图像识别技术。在内部测试中,识别精度可以达到90%。

微软识花:精细物体识别是怎么做到的

精确识别:不仅仅是人工智能

了精细物体识别有着极高的门槛,对于人类而言需要的是长时间的训练和知识的积累,此外还要求极为细致的观察能力。例如对于人们来说,可能很轻而易举地看出图片上的植物到底是花还是草,但却很难判断出花儿的具体种类。而由于计算机识别图像的方式原理与人类有所不同,因此这一类精细物体识别对计算机而言则相对简单。

这款应用使用流程很简单,背后的技术却不见得那么简单。市场上已经有一些识猫狗等动物的应用,而相比于识猫识狗,花的识别更具有挑战性。狗的种类不超过300种,而对花来说,已经被发现的野生植物就有几十万种,还有大量奇形怪状的新品种在不断地涌现。而微软亚洲研究院多媒体搜索组的研究员们在精确识别技术方面有着长久的积累,他们正希望做这样一些有挑战性的事情。

这款App主要应用了深度学习技术。研究员们借助中科院植物所提供的260万张花的鉴定照片,对机器识别模型进行训练。但是在弱监督的条件下,对260万张图片进行机器学习是一个相对低效率的过程,因为人的抽象能力和想象能力是计算机很难做到的。研究员傅建龙介绍道:“传统的深度学习技术是一个自下而上的学习过程,让计算机在底层的高维数据里学习隐藏的高层语义表达。如果我们能在人工智能之外加入人类智能,对机器的深度学习进行指导,把自下而上和自上而下的学习过程相结合,会大大提升深度学习的精度和效率。”把人类的经验和人工智能相结合,才能迸发出增强智能的魔力。研究员们正是在这方面下了很大功夫。

总所周知,分类学家对种类繁多的生物界做了一个阶层划分,即制定了“界门纲目科属种”的分类系统,做精确识别也需要一层一层递进,才能提高识别的准确性。在识花方面,主要是需要机器对“科-属-种“三个基本层级有一个提前的认知。研究员先加入一个花卉本身的层级结构,将它作为一种先验的知识,来指导机器学习。研究员们考虑到层级的信息,例如,不同的科的植物之间会不会有相关性?于是他们通过捕捉这样一种相关性来训练模型。

微软识花:精细物体识别是怎么做到的

按照“科-属-种”的层级划分,首先确定花的“科”,再通过一些细节的特征,例如花瓣的分布、形态等来确定它归于哪个“属”,最后通过花瓣的颜色、纹理等更为细微的特征来具体判断它属于哪个“种”。一朵花就是这样被计算机识别出来的,当然每一种花的识别过程也是“因花而异“的。

那么人类是如何识别出花的种类的呢?假设现在摆在我们面前的是一朵花的照片。我们首先会注意到这张图片中花出现的区域,确定这张图片上是否存在花,以及一共有几朵花,并排除旁边的草地等干扰项。接下来,你可能会将你的注意力放在花的一些关键特性上,如花的颜色、形状、大小等等。通过这些关键部位的特征,例如花是单朵顶生,颜色为黄色白色相见,形状呈杯型或碗型等特征,可以大致确定这是一朵郁金香。

研究员们基于以上人类观察物体、对物体的种类进行判断的过程,独具创新地开发了一个自动的视觉多级注意力模型,并结合深层神经网络技术,用于图像的处理与识别。第一级是物体级别的关注,即自动关注到图片中花所在的区域,而排除其他不相关的因素,如杂草等。第二级之后则是由粗到精的部位级别的关注,即关注到花的具体部位,然后对花朵的部位特征进行学习和识别。

微软识花:精细物体识别是怎么做到的

众所周知,深层神经网络技术在处理图像问题上的效果显著。但一直以来,深层神经网络都被称之为黑盒子,大家对它了解都不算充分,深层神经网络的理论方面还有待突破。但当黑盒子打开之后,大家能从中学习到很多的东西。研究员们通过一些可视化的策略,了解这些网络究竟学到了什么样的内容,看到每个卷积模板(filter)都代表什么样的语义。其实,卷积神经网络的中间层一些部位的信息已经可以自动学出来了,我们就把这些自动学出来的的模式(pattern)自动进行归类。这些归类出来的每一个聚类都可以理解成是花的某一个部位的集合。虽然模型本身并

本文来源:不详 作者:佚名

声明
声明:本站所发表的文章、评论及图片仅代表作者本人观点,与本站立场无关。若文章侵犯了您的相关权益,请及时与我们联系,我们会及时处理,感谢您对本站的支持!联系Email:support@txwb.com,系统开号,技术支持,服务联系QQ:1175525021本站所有有注明来源为天下网吧或天下网吧论坛的原创作品,各位转载时请注明来源链接!
天下网吧·网吧天下