天下网吧 >> 网吧系统 >> 系统动态 >> 正文

微软识花:精细物体识别是怎么做到的

2016-10-1不详佚名
不知道其中的某一个聚类究竟是花瓣还是叶子或是花蕊,但它已经知道这是属于某个部位的信息,这样就构建了部位检测模型。将由原始图像生成的每个候选框都经过每个部位检测器,而每个部位检测器则会自动检测出这个候选框内最接近这个部位的区域,这样就实现了第二级——部位级别的关注。

弱监督学习与大规模数据

提高图像识别系统的准确度,数据量始终是一个绕不开的关键问题。数据量越大越准确,那么最终训练出来的模型准确度也会相应地提升。对于花朵识别问题,研究员们起初是邀请一些植物学家们对花的图像进行种类标注。但研究员很快发现,这种标注数据的方式无论是从成本上还是时间效率上都算不上是一个最佳的选择。那么,有没有可能通过群体的智慧来解决这个问题呢?研究员们最终选择从由植物专家提供数据的专业网站爬取数据,并利用弱监督学习的方式进行数据的训练。

监督学习和无监督的学习概念大家已经不算陌生。前者会对数据进行标注,而后者则是对输入的数据集直接进行建模。研究员们在这里采用弱监督学习的方式是希望模型能够生成比较准确、清晰的标注,但前期的数据并不能完全提供这一类的信息,需要模型自己去推断。在看图识花的这个例子里,弱监督学习中的“弱”包含了这几个方面。第一点弱的地方在于用于机器学习的数据集只有图像级别的标注,即植物学家在标注图片时只标注了这张图片上有什么花,但是并没有标注花在哪,也并没有标注出最需要注意的关键识别区域在哪里(但人类判断的最关键的识别区域未必是计算机认为的最关键的识别区域)。其次,研究员使用的网络上大规模标注的数据的时候,这些数据并不一定是准确的,而且这类数据有着很多的噪声。此外,这些数据大多比较零散,结构化并不是很好。因此,弱监督学习的方式既可以兼顾到数据质量的不足,又可以保证用于训练的数据量的庞大,最终保证了入驻每个人手机中的微软识花应用的准确性。

携手植物专家:跨界玩创新

正如前面所言,植物专家的帮助对提高花卉的识别能力起到了基础支持的作用。这次“微软识花 “app的开发是微软亚洲研究院和中国科学院植物研究所多年来学术合作的成果。中科院植物所不仅提供了260万张花卉的识别图片,还提供了经过专家鉴定的中国常见花列表。而微软亚洲研究院的研究员们利用先进的技术开发出识别花卉的算法,并把识别结果挑选出来,经植物所专家鉴定。经过了两三次迭代的过程,才得到了最终训练机器识别的样本集合。中科院植物所植物专家的帮助对提高花卉的识别能力起到了基础支持的作用。此外,科学出版社为我们提供了花卉的专业知识。

这次合作缘于一次机缘巧合。去年,在中科院植物所举办的一次研讨会上,微软亚洲研究院常务副院长芮勇博士展示了研究院在计算机视觉方面的最新技术,植物所的专家很感兴趣,希望可以把最新的识别技术应用到我国的植物调研和科研中去。植物所的专家有这样一个初衷,那就是了解全中国的植被分布。之前由基层调研人员通过翻阅手册来判断各地有哪些花,但是基层人员的专业素养不可控。如果能够借助计算机技术帮助他们识别,那么速度和广度要提高很多。而微软亚洲研究院在深度学习算法和计算机视觉方面有着领先的技术基础,可以帮助他们做一些目前做不到的事。同时微软亚洲研究院的研究员们也希望借此机会,将精确识别技术更好地得到应用,并且在应用中进行进一步锤炼和创新。

微软识花:精细物体识别是怎么做到的

跨学科的学术合作也是微软亚洲研究院长期耕植的领域。“对于任何物种的分类都是艰难的,”芮勇表示。“关于这项技术的难点在于让计算机如何辨别细微的差异。而真正大的数据都在跨学科领域里产生的。我们与中科院植物所的这次合作为微软识花提供了大量的专业数据,让我们的计算机技术得以更好地应用。同时,微软的技术也在不断加速交叉学科的新突破。”

技术让生活更便捷

一款看似简单的应用背后却是微软长期以来在机器学习领域的技术积累和跨界合作的成果。微软亚洲研究院不仅重视基础研究的突破,还注重将基础研究的成果应用到更加广阔的生活和学术中去,让技术为人们真正带来改变。

在谈及微软识花之后的技术走向时,研究员傅建龙提到了多个发展方向。第一点是加入更多花卉的种类,将识别的范围拓展到多个国家,并且提供多语言的产品以及提供更多的平台。今后出国旅游也可以带上这位植物专家,帮你识别万千花卉。第二点是提高识别的精确度,在学术合作中推进数据库在质量和范围上的提升。第三点是拓展产品的科普功能,丰富关于花的知识,提供更多的互动功能,从而实现更好的科普。不仅让你知道是什么花,还为你拓展在博物知识方面的涉猎,让你离“博学之才“更近一步。第四点,研究员希望持续不断地精进识别算法模型,并实现离线版本与在线版本的无缝切换,让微软识花这一类精细物体识别技术也能以API的形式开放出来,登陆在像微软认知服务(Microsoft Cognitive Services)一样的人工智能服务平台,造福更多的开发者们。最后一点是希望该项目能对专业研究者的科学研究带来便利,比如帮助植物专家发现新的物种、帮助基层调研人员精确识别花卉品种等。

本文来源:不详 作者:佚名

声明
声明:本站所发表的文章、评论及图片仅代表作者本人观点,与本站立场无关。若文章侵犯了您的相关权益,请及时与我们联系,我们会及时处理,感谢您对本站的支持!联系Email:support@txwb.com,系统开号,技术支持,服务联系QQ:1175525021本站所有有注明来源为天下网吧或天下网吧论坛的原创作品,各位转载时请注明来源链接!
天下网吧·网吧天下