天下网吧 >> 网吧系统 >> 系统动态 >> 正文

《纽约时报》深度剖析谷歌大脑简史

2016-12-16不详佚名
非常大的、全面的程序,包含了逻辑推理的规则和有关世界的充分的知识。这种观点通常被称为“符号AI”,它对认知的定义是基于符号逻辑的。

符号AI有两个主要问题。一是非常耗费人力和时间,二是只有在规则和定义非常清楚的领域才能有用:比如数学或国际象棋。使用符号AI做机器翻译效果极差,因为语言虽有规则,但复杂多变,并且还有很多例外。但对于数学和国际象棋来说,符号AI工作得很好,而符号AI的支持者也认为,没有什么比数学和国际象棋更能代表“通用智能”。

1961年一部纪录片的节选,强调人工智能研究长期以来的观点:如果可以编程计算机模拟高阶认知任务(比如数学或象棋),就能沿着这种方法最终会开发出类似于意识的东西。来源:Roberto Pieraccini/YouTube/NYT

但符号AI系统能做的事情是有限的。20世纪80年代,CMU的一位机器人研究员指出,让计算机做成人能做的事情很简单,但让计算机做一岁儿童做的事情几乎不可能,比如拿起一个球或识别一只猫。到20世纪90年代,尽管在国际象棋上取得了很大的进步,我们仍然离通用人工智能很是遥远。

关于AI还有一个不同的看法,这种观点认为计算机将从底层(数据)而不是从顶层(规则)学习。这个概念可追溯到20世纪40年代初,当时研究人员发现灵活自如智能的最佳模型就是人类大脑本身。说到底,大脑只是由神经元组成的,神经元之间可以相互通电(或不通电)。单个神经元并不重要,重要的是神经元的整体连接。这种简单的结构为大脑提供了很多优势,能够适应环境。大脑可以在信息很差或缺失的情况下工作;可以承受重大的损害,也不会完全失去控制;可以以非常有效的方式存储大量的知识;可以清楚区分不同的模式,同时又保留足够的混乱以处理歧义。

你可以用电子元件模拟这种结构,1943年的实验表明,简单的人工神经元网络可以执行基本的逻辑运算。这些电子元件至少在理论上,可以学习我们人类做事的方式。在生活中,我们会通过各种试错改变神经元对之间的突触连接的强弱。人工神经网络也可以做到类似的事情,通过不断试错,改变人工神经元之间的数字关系。人工神经网络不需要使用固定的规则预编程,它可以改变自身以反映所吸收的数据中的模式。

这种对人工智能的看法可以说是演化论而不是创造论。如果你想要一个灵活的机制,能够适应环境,你最开始就不想灌输它固定的规则。你可以从非常基本的能力——感官知觉和运动控制开始,希望更高的技能有机地出现。人类不是通过背诵字典和语法书学习理解语言,所以为什么要让计算机这样做呢?

谷歌大脑是第一个对上述想法进行商用投资的机构。Dean、Corrado和吴恩达(兼职)开始合作,立即就取得了进展。他们从最近的理论大纲以及自20世纪80年代和90年代的想法中吸取灵感,并利用谷歌无与伦比的数据储备和庞大的计算基础设施。他们将大量“标记”数据输入网络,计算机的输出不断改进,愈发接近现实。

“动物演化出眼睛是一个巨大的发展,”Dean有一天告诉我。我们像往常一样坐在会议室里,Dean在白板上画了一条繁复弯曲的时间线,表现Google Brain以及这个团队与神经网络的历史关系。“现在计算机也有眼睛了。我们可以以此为基础让计算机理解照片。机器人将得到彻底地改变。机器人将能够在一个未知的环境中,处理许多不同的问题上。”他们在机器人身上开发的这些能力可能看起来很原始,但其意义却是深远的。

2.多伦多大学教授Hinton成为谷歌的实习生

《纽约时报》深度剖析谷歌大脑简史

Geoffrey Hinton在谷歌多伦多办公室。他的想法为谷歌神经网络机器翻译方法奠定了基础。来源:Brian Finke for The New York Times

Dean表示,Google Brain成立后一年左右,开发具有一岁儿童智力的机器的实验取得了巨大的进展。谷歌的语音识别团队将其旧系统的一部分改为神经网络,并且效果得到很大提升,甚至取得了近20年中最好的成果。谷歌物体识别系统的能力也提高了一个数量级。这不是因为Google Brain团队成员在短短一年间产生了一系列超棒的新想法,而是因为谷歌终于投入了资源——计算机和越来越多的人力。

Google Brain成立的第二年,Geoffrey Hinton加入了,而吴恩达则离开(现在是百度首席科学家,领导1300人规模的AI团队)。Hinton当时只想离开多伦多大学在谷歌待三个月,所以由于各种原因,谷歌不得不被聘他为实习生。在实习生培训过程中,辅导人员会说“输入你的LDAP(及用户登录码)”,Hinton会举手问:“什么是LDAP?”在场所有二十几岁的年轻人,只知道人工智能的皮毛,都在想“那个老家伙是谁?为什么他连LDAP都不懂?”

Hinton说,直到有一天,有人在午餐时对他说“Hinton教授!我选修了你的课!你在这里做什么?”自此以后,再也没有人质疑Hinton作为实习生的存在。

几个月后,Hinton和他的两个学生在ImageNet大型图像识别竞赛中取得了惊人的成果,让计算机不仅识别出猴子,而且区分蜘蛛猴和吼猴,以及各种各样不同品种的猫。谷歌很快就向Hinton和他的学生提出了Offer。他们也都接受了。“我以为他们对我们的知识产权感兴趣,”Hinton说:“结果他们对我们这几个人感兴趣。”

Hinton出身于一个古老的英国家族。他的曾祖父George Boole在符号逻辑方面的基础工作为计算机专业打下基础;Hinton的另一个曾祖父是著名的外科医生,Hinton的父亲是一个热爱冒险家的昆虫学家,Hinton父亲的表哥在Los Alamos研究所工作,等等等等。Hinton先后在剑桥大学和爱丁堡大学学习,然后在卡内基梅隆大学读博士,最后到了多伦多大学,现在Hinton大部分时间都在多伦多大学。(Hinton的工作长期以来一直受到加拿大政府的慷慨支持。)我在Hinton的办公室访问了他。Hinton说话睿智诡异,比如“计算机会比美国人更早理解讽刺”。

Hinton从上世纪60年代末在剑桥大学读本科开始,一直致力于研究神经网络,也被认为是该领域的先驱。很长时间以来,每当Hinton说起机器学习,人们都用不屑的眼神看着他。神经网络一度被视为学术死路,主要是由于感知机(Perceptron)这个当时得到过度吹捧的概念。感知机是康奈尔心理学家Frank Rosenblatt在20世纪50年代末开发的一个人工神经网络。当时《纽约时报》报道,感知机项目自助者美国海军期望它“能够走路、说话、会看、会写,会生产(reproduce)自己,意识到自己的存在”。结果这些感知机基本都没实现。马文·明斯基(Marvin Minsky)在1954年普林斯顿的论文中以神经网络为研究主题,但他对Rosenblatt关于神经范式所做的夸张说法已经厌倦了。(明斯基也在争取国防部的研究资金。)后来,明斯基与MIT的同事合作出版了一本书,证明有一些非常简单的问题是感知器永远不能解决的。

明斯基当时对感知机的批评只涉及只有一个“层”的网络,也就是在输入和输出之间只有一层神经网络——后来明斯基阐述了与当代深度学习非常相似的想法。但是,当时Hinton就已经知道,如果使用很多层神经网络,就可以执行复杂的任务。简单说,神经网络就是一台机器,能够从数据中发现模式并以此进行分类或预测。有一层神经网络,你可以找到简单的模式;有多层神经网络,就可以找出模式中的模式。以图像识别为例,执行图像识别的神经网络主要使用“卷积神经网络”(这在1998年的一篇开创性论文中阐述的概念,该论文的主要作者、法国人Yann LeCun跟着Hinton在多伦多大学做了博士后,现任Facebook人工智能实验室负责人),网络的第一层学习识别图像非常基本的视觉效果“边缘”,也就是

本文来源:不详 作者:佚名

声明
声明:本站所发表的文章、评论及图片仅代表作者本人观点,与本站立场无关。若文章侵犯了您的相关权益,请及时与我们联系,我们会及时处理,感谢您对本站的支持!联系Email:support@txwb.com,系统开号,技术支持,服务联系QQ:1175525021本站所有有注明来源为天下网吧或天下网吧论坛的原创作品,各位转载时请注明来源链接!
天下网吧·网吧天下