这几天最有趣的消息莫过于Uber相关关键字被微信屏蔽的事。腾讯的回应说“系统抖动”造成的这次屏蔽,结果引起了更多争议,有人表示相信,有人表示不信。而我,则是半信半疑,我相信这件事一定有技术因素,但我同样相信背后有非技术因素影响,故为半信。
之前有一篇文章大概是从网上抄来一个“系统抖动”定义,那个解释跟这件事完全没关系。所以,我们先猜测下系统抖动到底是什么,会造成什么影响。
在互联网以及计算机行业,系统抖动本来也不是一个严谨的工程名词,不同的系统设计和架构,会出现完全不同的状况。如果非要概括一下,微信所指的应该是指因为分布式系统数据同步的差异,从而造成的系统表现出来的不一致状态。中国用户比较容易体会到类似的系统抖动,大概有两个案例,其一是所谓的Google Dance,就是在Google上时而搜不到一个网站,过几天又可以搜到了。这是因为Google在更新巨大的网页索引库的时候,不同节点的索引版本不一样,导致排序算法暂时混乱。而过了一段时间,数据同步了,自然也就好了。如果你从来没注意过这件事,可能是因为在中国一会能访问Google,一会又不能访问。这就是其二,伟大的GFW系统封网站的时候出现了类似问题,大多数情况下会封掉Google,但某些时候因为数据同步和更新的问题,又导致Google被解封,用户就感觉偶尔能访问一下,但大部分时间不行。
这两个例子说明这类技术问题确实很常见,最终用户也很容易会感知到它的存在。但这种技术问题的特征应该是偶然发生,持续时间不长,并且分布平均。比如Google Dance不可能只针对一个网站出现,而是机会平均被各种网站遇到,如果每次都是腾讯域名下所以页面都搜索不到,那就不是系统抖动了。而GFW抖动造成被封网站突然能用,也不仅仅限于Google,其他网站,比如Facebook、Twitter也时而会出现突然能访问的状况,按照这个特征对照一下Uber遇到的情况,就会觉得这不是常规意义的“系统抖动“。
我自己写不少Uber相关的文章,对Uber非常关注,微信上也有不少在Uber工作的朋友。时而会遇到他们说自己的官方帐号不能访问了,或者贴个图问大家能不能看到。对Uber的屏蔽一直是逐步升级的,而且也确实持续了三个月。系统如何抖动,和架构设计和原理有很大关系,但既然叫做抖动了,它必须得是在抖才合理。想想抖动这个词在现实世界本来的含义是什么?抖,应该是忽然向上、忽然向下,一会儿正常、一会儿不正常,这样才叫抖。Uber是持续遇到问题,一边倒,这怎么能叫做抖呢?我觉得叫做“系统倾翻”更符合这种一边倒情况。
微信的反垃圾拦截系统具体设计和算法不得而知,但所有反垃圾系统使用的数学方法万变不离其宗。它肯定是一种基于概率的过滤器算法。我并不打算在这解释数学原理,霍金说:“一本书中多一个数学公式就会减少一半读者”,所以我就一个公式也不写,只解释一下大致原理。
以比较常用的贝叶斯过滤器当例子,贝叶斯概率是从一个主观假设开始,通过逐渐补充的数据计算来修正最初假设的过程。在这个过程中,主观假设是可以随便设置的,比如:假设公众帐号发表的文章中,有30%是违反规则的垃圾文章。然后用事实去修正它。所谓修正,就是持续告诉系统这一篇不是垃圾,那一篇是垃圾的过程。在这个模式里面,最早的猜想叫做先验概率,通过一系列的事实修正,最终得到的结果叫做后验概率,后验概率就可以用来判断一篇文章是不是违规了。实际应用系统会比这个复杂的多,但原理应该差不多,总是根据一个假设和事实修正逐渐接近事实情况的优化过程。在这个过程中,四处是可以调整的参数,并且会直接影响最终效果。在这类系统中,如果不是专门为Uber调整了某些参数,我实在没法从技术角度理解这种所谓的系统抖动是如何发生的。
退一步说,就算真是系统自发的错误行为,相关团队也应该早就应该通过优化的方式解决这一问题,而不至于等到大众媒体都开始关注才发现。就说诱导分享这件事,整个微信世界还有比滴滴红包更频繁,更广泛的诱导分享吗?恐怕找不出第二个案例来。但滴滴这样做就是没事,这如果也不是人工优化参数的结果,我只能认为腾讯已经孕育出了超越人类智能的人工智能了。据Uber的官方说明,他们此前已经多次和腾讯联系试图解决问题,结果就是解决不了。另外一方面,Uber中国团队也有不少曾经在腾讯工作过的人。无论是私下渠道还是公开渠道,腾讯应该都不会是这几天才知道这件事存在吧。这些情况放在一起,就更不是单一技术问题能够解释的。
另外,我时而会举报一些确实是”诱导分享“的文章,以试图测试微信的行为模式。不过到目前为止无一成功,都被系统回复了举报失败。可见这个诱导分享的判断门槛并不低,对比前一段常见的Uber相关文章被“多人举报”的情况,我不禁对这位”多人“同学非常佩服,一举报一个准。我时而感叹世界上最强大的情报机关中,中国拥有两个,一个是”多人“,一个是”朝阳群众“。
我的“半信半疑“的半疑就来源于此。到现在为止,技术上的解释没法让我相信。当然了,技术上的解释合理不合理并不重要,从阿里到腾讯,技术在关键时刻总是被拿出来“独挡一面“,重要的是将来会怎么样。
所以所谓半信,除了相信存在一些技术因素,即,确实和算法有一些关系,而不是直接屏蔽一个关键词之外。我更愿意相信微信把事情做好的愿望。在中国普遍的职权不分的情况下,微信能回应此事,并且确实在解决,已经不容易了。
对于未来我就保持一个半信的态度。对于大企业内部利益的平衡方式,是中国企业和美国企业最大的区别,当然也可以认为是中国社会和美国社会最大的区别。每次大家说起来Google的某些团队竟然要招聘SEO(搜索引擎优化)人员,就觉得是个笑话,但这恰恰说明了Google内部有防火墙,可以隔绝各部门利益。这是成为一个公平平台的关键。这种公平,正是平台型公司获得信赖的关键。在中国,恐怕还没有哪家互联网公司能做好这件事。
另外,这件事由Uber引发并不奇怪。Uber是罕见的大规模冲击现实世界的公司,在之前,互联网公司里面只有电商企业真正冲击了现实世界。别说腾讯这样一家企业,就算是各国政府不也正在Uber引发的浪潮中颠三倒四,做出各种怪事来吗?
这里再顺便说一个这几天发生的好玩事。此前我写过我们这个加拿大城市发生的Uber和市政府对抗的故事,最近这故事又有了新升级。本市出租车联盟主席责怪市长,说应该让警方来按照《安省高速法案》严格执法,打击Uber。我们的市长竟然真的致电警方,要求警方严格执法。对于一个三权分立的国家,这简直是天大的笑话。市民简直被震惊了,人们纷纷评论说市长你是Peace offer,有什么权利去要求Police Offer按照你的要求执法啊?果不其然,几天之后警方发言人得体的回复:“夏天是我们最忙的时候,我们最重要的职责是保护市民安全,打击犯罪,保证交通畅通,其他不重要事务暂时没人手专门处理。”
一个三权分立了上百年的国家,其首都都被搅和到这样颠三倒四,恨不得和中国一样设立政法委组织联合办公,腾讯做为一家公司稍微有点混乱也不算什么奇怪的事。
对于Uber这样一家公司,并不需要给予他们特别的同情,只要给他们不要太不公平的环境即可。必须要说,微信在维护
本文来源:不详 作者:佚名