该研究团队虽然对其算法超越人类视觉识别极限感到兴奋不已,但与该领域的其他研究人员一样,研究团队成员也强调,计算机视觉目前从根本上仍无法与人类视觉相比。计算机系统在识别物体、理解图像上下文及场景高级信息等领域仍面临诸多挑战。
“虽然我们的算法基于该特定的数据集得出了极为理想的结果,但这并不表明在对象识别领域机器视觉普遍优于人类视觉。某些对于人类来说轻而易举的基本对象类别的识别,机器识别仍然存在明显错误。尽管如此,我们的研究结果表明机器算法在众多视觉识别任务上具有巨大的发展潜力。”
“人类可以毫不费力地区分出一只羊和一头牛。但计算机在执行这些简单任务时却不尽完美,”孙剑解释道。“但是,当涉及到不同品种的羊的区分时,计算机可超越人类。通过训练,计算机可观察图像的细节、纹理、形状及环境,并发现人类无法察觉出的区别。”
微软研究团队的工作并不仅仅局限于基础研究,其多项成果已被应用到微软的产品和服务中,包括必应图片搜索及微软云存储解决方案OneDrive。在近期的一篇博文中,微软OneDrive项目经理Douglas Pearce介绍了OneDrive自动识别照片内容的功能。
“OneDrive会自动为用户上传的照片创建标签,比如人、狗、沙滩、落日等等,使用户借助标签能够更轻松地寻找到自己的图片。有了这项功能,我们向演示项目中添加照片、与家人重温特殊回忆,或与Facebook好友分享重要时刻就变得轻而易举。”Pearce如是说。
想要了解此项技术背后原理的读者可阅读微软研究院去年发布的专题文章。该文章介绍了来自同一研究团队的研究成果,他们在保持准确性不变的条件下将深度学习目标检测系统加速了多达100倍。该团队的科研进展记录于题为“Spatial Pyramid Poolingin Deep Convolutional Networks for Visual Recognition”研究论文中。
“微软亚洲研究院视觉计算研究组一直致力于推动计算机视觉研究的前沿发展,终极目标是使计算机能够模拟出人类的感知能力。我对研究组多年来所取得的成就深感自豪,他们不仅以高质量的论文取得了学术界的认可,而且通过将这些技术转化到了微软的多个核心产品中。”微软亚太研发集团主席兼微软亚洲研究院院长洪小文博士说道。
2010年,来自斯坦福大学、普林斯顿大学及哥伦比亚大学的科学家们启动大规模视觉识别挑战赛(Large SCale Visual Recognition Challenge),推动了计算机视觉识别挑战的持续发展。科技行业知名记者John Markoff于2014年8月在《纽约时报》上刊登文章指出,2014年计算机识别挑战的目标识别准确率几乎提升了一倍,图像分类错误率也减少了一半。最近,百度的研究人员在其论文中宣称,以ImageNet对象分类为基准,百度的计算机视觉系统实现了前五选5.33%的错误率。
关于计算机视觉的挑战仍在继续,今年的挑战赛将于12月启动。但这并不是孙剑、何恺明及其研究团队的关注重点。“我们的目标是在众多应用上开发出能与人类视觉媲美,甚至比人类更准确的计算机视觉系统,”孙剑说道。“如要实现这一目标,我们需要更多的训练数据和更加真实的测试场景。我们在必应、OneDrive和其他服务平台上的工作将帮助我们进一步改善算法的鲁棒性(注:鲁棒性,即强壮性,Robust)。”
关注天下网吧微信,了解网吧网咖经营管理,安装维护:
本文来源:不详 作者:佚名