您现在的位置: 天下网吧 >> 网吧天下 >> 网吧行业 >> 网络追踪 >> 正文

详解谷歌搜索三大法宝

[作者:佚名 来源:不详 时间:2015-1-19我来说两句
“知识图谱”较为动态。不过这款产品逐渐掌握谷歌搜索本身所具有的学习能力,能够分析用户的习惯。莫斯利举了“谁在电影《太空炮弹》(Spaceballs)中扮演Barf?”作为例子,“知识图谱”已经接触了非常多词条,因而知道如何提供涉及演员和电影的图解——并且以非常快的速度完成。

“知识图谱”也在另一个重要领域——新鲜度——取得较大进步。由于谷歌假定对一个问题提供一个正确答案,因此其信息必须与时俱进。否则,答案会是错误的,对用户造成的影响会比没有答案更糟糕。莫斯利表示,“知识图谱”在2012年推出的时候,其中一个实体的变化——例如大众汽车(Volkswagen)决定聘请新的首席执行官——该系统可能要花长达2周来反映这种变化。现在该系统能够在几分钟内处理这些新闻并进行调整。但是她承认,对“知识图谱”而言,这种特定的“大众汽车首席执行官”词条既是成功也是失败。新任首席执行官要几个月后才会正式上任。“知识图谱”仍然展示当前的领导人,不过很多在谷歌输入“大众汽车首席执行官”词条的用户可能寻求的是有关继任者的信息。因此,尽管“知识图谱”是正确的,其回复可能不会令用户满意。

谷歌还需要进行很多改进。首先是增加更多领域和行业;该项目最近增加了汽车、视频游戏及雨果奖(Hugo Award)获奖者的知识。不过她表示,谷歌正尝试找出如何提供更加复杂的结果——不再只是快速事实,还提供更主观、更模糊的联想。“人们不只是对事实感兴趣,”她说。“他们对一些主观性的东西也感兴趣,如该电视节目是否好看。这些东西能帮助将‘知识图谱’提升至新的级别。”这就像谷歌并不希望让用户感觉自己在进行机械搜索,而是咨询一位圣人,这位圣人不仅无所不知而且在文化方面还具有自己的独立见解。

不过这还需要走很长的路,并且由于对“知识图谱”所提供信息的预期提升,其所犯错误也不断令用户感到失望。莫斯利最近较为烦恼,因为她意识到“知识图谱”虽然了解电视节目的信息,但是缺乏有关新节目以及何时播出的内容。她说:“我希望有这样的提醒,能告诉我本周有新节目播出,我也想知道哪些网站有放映,从而可以登陆观看,”承诺最终谷歌将穿越这个“中间阶段”,虽然该项目还没有将所有东西都收入到目录中。

谈到期望提升,可能“知识图谱”最显眼的错误是谷歌在2010年夏天收购Metaweb时提到的两个问题。4年后,其搜索引擎仍然未能对“美国西岸学费低于3万美元的大学”或“至少夺得过一个奥斯卡奖项的40岁以上艺人”等问题提供一站式答案。

语音输入

在意识到移动技术将变得无处不在后,谷歌决定对搜索业务进行一项细微但意义重大的调整。该公司不再将搜索词条视为向计算机系统提交的指令,而是把所有输入的内容都当成是对话。“很显然,一旦你拥有这种类型的设备(他举起手机做例证),语音输入将变得非常重要,”本·戈麦斯说,“同样非常明确的是,用户说话比打字更自然。”

这种调整不仅涉及改变搜索引擎处理词条的方式。它意味着改变我们。我们现在可以将搜索框——不管在PC或在移动端上——视为可以进行对话的对象。塔玛尔·耶霍舒亚(Tamar Yehoshua)表示:“在谷歌出现前,人们并没有词条的概念,我们花了多年时间教会大家使用词条。不过,如果你以平常的方式进行交流,不必进行很认真的思考,这样不是更轻松吗?这会是非常美好的情景。”

进行这种变革需要2个方面。首先,谷歌的搜索引擎必须加强,从而更仔细地倾听,对输入的语音内容进行分析。之后谷歌必须确保当用户向手机发出语音指示——或者在搜索框通过文字进行交流,其系统会理解用户在说什么。

的确,谷歌已经在语音识别方面进行了一段时间的努力。“在很多年前,我们当然知道这些基础部分——语音、自然语言处理——将具有重要意义,”耶霍舒亚说。“我们知道那些都是投资,都是科技界未曾解决的问题,我们需要花多年时间才能收获成果。”在20世纪初的几年里,谷歌有一项服务名为Google 411,所做的事情跟用户拨打(付费)电话号码查询系统时电话公司所做的事情一样。谷歌使用那数百万的免费电话来学会如何正确地解译不同语言和口音的语音。这一点非常有用,不过在其他一些地方,谷歌并没有获得分析语音输入所需的大约2500个短语样本。因此,该公司开始派遣小型团队到多个不同的地区,并在此之前在谷歌网络发布消息称该公司希望收集语音样本。在印度尼西亚进行的努力具有代表意义。谷歌语音专家林奈·哈(Linne Ha)说:“在第二天,有900人现身。”谷歌进行这些研究的时候,会选择在与该地区相匹配的现场条件进行收集:如在香港的街道和巴黎的地铁路里记录物体。

这些努力获得了回报——谷歌搜索支持159种语言,语音搜素(Voice Search)现在支持其中58种语言。谷歌声称该应用的“错词率”已经降低至8%。

戈麦斯自豪地指出谷歌发展过程中的一个里程碑:他现在亲自进行语音展示。“我的口音非常不标准,”这位印度裔工程师说。“我的元音发音是美国的,不过我不发R的的音。”在这个语音项目前,戈麦斯从未亲自去证明谷歌在语音识别方面的努力:相反,该公司使用一位内部的专家,他具有纯正的美国口音,能够与机器和谐共处。现在,戈麦斯已经与这位专家失去联系。“他不再是对这份工作非常重要,”他说。“我可以亲自进行展示。让我坐在记者面前,亲自进行语音输入,我对此毫不畏惧。”

谷歌还必须考虑电话向用户回应的方式。应该像Siri那样的拟人化形象,还是使用明显的机器人语调从而让用户意识到自己在跟系统对话?谷歌选择了后者。该公司搜索设计主管琼·威利表示,为了成功实现与一个有意识个体对话这种错觉,他们必须达到皮克斯(Pixar)般故事自动叙述能力。“我认为从具有个性的计算机到人类与之自然交流还有很长的路要走。”

不过科技迅速发展,已经足以让谷歌(当然,也包括其他一些公司)达到研究人员数十年来所幻想的语音互动级别。“我认为三或四样东西推动实现了这种可能性,”戈麦斯说。“显然,计算机变得更快且运算能力变得更强。硬件——麦克风——也变得更好。软件算法方面也有进步。不过最大的变化是我们理解语言的能力。”

费尔南多·佩雷拉(Fernando Pereira)是搜索部门的“杰出搜索科学家”(Distinguished Research




关注天下网吧微信,了解网吧网咖经营管理,安装维护:


本文来源:不详 作者:佚名

声明
本文来源地址:http://www.ithome.com/
声明:本站所发表的文章、评论及图片仅代表作者本人观点,与本站立场无关。若文章侵犯了您的相关权益,请及时与我们联系,我们会及时处理,感谢您对本站的支持!联系邮箱:support@txwb.com.,本站所有有注明来源为天下网吧或天下网吧论坛的原创作品,各位转载时请注明来源链接!
天下网吧 网吧天下