连线杂志：谷歌算法统治互联网的秘诀

2010-2-26新浪科技钦亮

【大中小】

　　这是谷歌从无数次搜索中获得的可贵知识。石头可以是“rock”，可以是“stone”，还可以是“boulder”(漂石)。如果用户输入“rokc”，谷歌仍会知道他想找的是“rock”。但如果在“rokc”前加“little”，谷歌则会知道这是“Arkansas”(阿肯色州)的首府。“Arkansas”的缩写是“ark”，与诺亚方舟同形，但谷歌会将二者区分开来。辛格说：“搜索中最重要的是理解用户的意图，因此你不是在匹配词语，而是在匹配意思。”

　　谷歌一直在不断改进。近期，谷歌工程师莫琳·海曼斯(Maureen Heymans)发现了“Cindy Louise Greenslade”的搜索结果的问题。用户输入这些单词时，算法会认为应该找一个名叫Cindy Louise的人，于是在加利福尼亚的加登格罗夫市找到了一名心理学家，却没有把姓名为“Cindy Louise Greenslade”的人的网页放在结果的前十名。海曼斯发现，这是因为“Cindy Louise Greenslade”习惯将名字缩写成“Cindy L. Greenslade”。她表示：“我们的搜索引擎应该更聪明一点。”于是她增加了一个信号，用来寻找中间名的缩写。现在正确的结果已经被排在了第五位。

　　层出不穷的创新

　　在任何时候，谷歌高效运转的测试系统都会进行几十个这种改进。谷歌在全世界专门雇佣了上百人，这些人坐在家里的电脑前判断更改后的结果是更好还是更差。但谷歌还有一个更大的测试团队，这就是成千上万的谷歌用户，他们不知不觉地加入了这项长期的质量实验。

　　每当工程师想测试一项技术调整时，他们会在一小批随机用户中运行这些算法，而绝大多数的用户扮演的是参照组的角色。需要测试的更改太多，因此谷歌放弃了一次只测试一项技术调整的策略。搜索质量工程师帕特里克·赖利(Patrick Riley)表示：“在大多数搜索过程中，你同时都处于多个‘实验组’和‘参照组’之中。”但他随后又做出了更正：“事实上，所有搜索都被卷入了实验之中，因此用户每次用谷歌搜索，都作了一次‘小白鼠’。”

　　这种灵活性——增加信号、更改代码、立即测试的能力——就是谷歌团队为什么说他们可以应对来自必应、Twitter和Facebook的任何挑战的原因。事实上，在过去的六个月中，谷歌进行了200多项改进，其中一些似乎在模仿(但超越了)它的竞争对手(谷歌表示这只是巧合，称其多年来一直在增加新功能)，其中之一就是实时搜索。

　　佩奇数月前曾表示谷歌应该每一秒钟都搜索整个网络，因此使这一功能备受期待。当用户搜索具有时效性的话题时，谷歌结果页面的10个蓝色链接中会有一个“最新结果”框。该框带有拖动条，显示的是从新闻媒体、博客和Twitter等获得最新内容。同样，谷歌使用信号来确保最有用的tweet(Twitter上发布的消息)出现在实时信息框中。

　　除了实时搜索，谷歌还引入了一项新功能，称作“Goggles”。该功能可以将用户手机上拍摄的照片视作搜索请求。谷歌一直努力将搜索变成一种随时随地的行为，“Goggles”也是该努力的一部分。有了摄像和语音识别功能，智能手机就会变成你的眼睛和耳朵。只要找到正确的信号，任何东西都可以变成搜索请求。9 7 3 1 2 3 4 5 4 8 :

本文来源：新浪科技作者：钦亮

上一篇文章：谷歌延迟推出Caffeine搜索平台

下一篇文章： LG将于9月推出Windows Phone 7设备

权威杂志调查：滴滴在中国打车市场的地位基本动不了   《福布斯》杂志中文版将解散运营团队并非停刊   纸媒寒冬：22年老牌杂志《环球企业家》将清算
《连线》：阿里巴巴有潜力成为下一个谷歌   时代华纳旗下杂志部门时代分拆上市首日破发   连线：谷歌为何急于成为游戏公司
连线：亚马逊或能帮助Twitter提升活跃度   《财经》杂志封面文章：立规互联网金融   比杂志还轻薄送礼必备11.6英寸本盘点
《连线》主编投身3D打印领域前景成疑

聚合推荐

2022年网吧恢复营业时间网吧卫生网吧电脑配置开网吧网吧键盘网吧配置网吧GHOST ROS 网吧软件故障解决网众无盘网吧游戏菜单网吧活动网吧优化网吧精品网吧新手

声明

声明：本站所发表的文章、评论及图片仅代表作者本人观点，与本站立场无关。文章是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益，请作者持权属证明与本网联系，我们将及时更正、删除，谢谢。 Email:support@txwb.com，系统开号，技术支持，服务联系微信：_WX_1_本站所有有注明来源为天下网吧或天下网吧论坛的原创作品，各位转载时请注明来源链接！

天下网吧·网吧天下