国外媒体近日发布文章称,神经网络算法已然成为主流技术,可显著提升语音识别准确率,让科技巨头们的产品服务变得更加智能,如谷歌Android的语音识别功能和微软Skype Translate。唯独苹果Siri还没有拥抱该项技术,不过该公司已经获得了Nuance语音技术使用授权,也招揽了诸多该领域的人才,预示着获神经网络助推的Siri版本即将到来。
以下是文章主要内容:
神经网络
一切始于在加拿大不列颠哥伦比亚省惠斯勒的一次小型学术聚会。
当时的话题是语音识别,以及未经检验的新型机器智能——名为深度学习————是否可以帮助计算机更加准确地识别口头语言。该小型会议由微软赞助,举行于2009年圣诞节前,其中的两位研究人员邀请了世界知名的深度学习专家、来自多伦多大学的杰夫·辛顿(Geoff Hinton)发表讲话。
辛顿的理念是,机器学习模式可很大程度上类似于人脑运作。他想要打造“神经网络”来逐渐形成对口头语言的理解,该类网络也在越来越多地出现。神经网络曾在1980年代流行一时,但直到2009年它们才发挥出它们的潜能。
据微软研究部门主管彼得·李(Peter Lee)称,在惠斯勒,与会的语音研究人员友好对待该理念,但“兴趣并不浓厚”。那些研究人员当时已经开发了自有的算法。但在微软的团队看来,深度学习值得一试,所以该公司让一些工程师与辛顿的研究团队展开合作,用真实数据运行了一些试验。
彼得·李回忆道,试验结果“让人大吃一惊”——语音识别准确率足足提升了25%以上。要知道,那是一个5%的提升就称得上变革性的领域。“我们公布了那些试验结果,世界随即发生改变。”他说道。
如今,差不多5年过去,神经网络算法成为了主流技术,它们以全新的、令人兴奋的方式使得计算机变得更加智能。谷歌利用它们来强化Android的语音识别功能。IBM也用到它们。而最受瞩目的是,微软将神经网络应用于《星际迷航》式的Skype Translate翻译功能,使得该服务能够即时将你说的话翻译成另一种语言。
辛顿指出,“人们一开始并不相信该类技术,而现在我们的技术已经成为了主流。”
Siri将获升级
然而,有一家大名鼎鼎的公司还未转向神经网络算法:苹果,它的Siri软件将迎来升级。虽然苹果一向对其内部运营三缄其口,但该公司似乎已经从Nuance(也许是最有名的语音识别技术提供商)获得了语音识别技术使用授权。人工智能研究社区认为,Siri即将发生改变。
他们指出,很明显,苹果已经成立了自家的语音识别团队,获神经网络助推的Siri版本即将到来。
彼得·李对此很清楚。苹果去年招募了他麾下的其中一名高级经理阿莱克斯·阿塞罗(Alex Acero)。阿塞罗现在担任苹果Siri部门的高级总监,他曾在微软研究了近20年的语音技术。在微软,他的下属包括邀请辛顿参加那次学术聚会的两名研究人员Li Deng和Dong Yu。
苹果还从Nuance挖来了一些语音研究人员,其中包括Siri经理贡纳·艾弗曼(Gunnar EVErmann)。爱丁堡大学研究人员阿纳布·戈沙尔(Arnab Ghosha)亦在被苹果招致麾下的语音研究人员之列。
“苹果不仅仅招揽经理级别的人才,还招揽团队领导和研究级别的悍将。”被苹果追求过的多伦多大学博士后研究员阿卜杜勒-拉赫曼·穆罕默德(Abdel-rahman Mohamed)说道,“他们在打造一支非常强大的语音识别研究团队。”
雅虎研究主管、曾帮助启动Siri前身项目的罗恩·布拉赫曼(Ron Brachman)指出,苹果的iphone数字助手将远不止是依赖语音识别技术。微软的彼得·李认为,苹果要花六个月的时间才能赶上微软和谷歌,而开始使用神经网络会给Siri带来很大的提升。
“除了苹果Siri之外,所有的大玩家都已经完全技术转换。”他说道,“我认为,Siri转向神经网络只不过是时间早晚的问题。”
关注天下网吧微信,了解网吧网咖经营管理,安装维护:
本文来源:不详 作者:佚名