腾讯数码讯(编译:刘微晓)自从去年10月份Siri与iPhone 4S同步推出至今已经过去了一年多的时间了,回想当初,我第一次见到这个东西就觉得它蕴藏着极大的潜力。我这么说的理由是:1)自然语言界面也许有一天能够完成触摸板或者图形才能实现的对命令行的指令;2)多亏有了自然语言界面的诞生,苹果终于可以摆脱google搜索的限制,进而演变成参与者的角色;3)凭借自己在搜索中扮演的角色,苹果还能同时获得了用户的数据分析。
就客户端而言,我很享受由Siri传递给我的搜索相关信息内容和说明的结果。希望苹果今后能够实现:1)将其变成Spotlight,这样在以后即使发音不准或者语言解析器不好使的情况下也不会影响使用;2)修复自然语言解析器频繁故障的问题。
话题拉回来,自Siri出现以后苹果就成了联系用户与饭店,餐馆,影讯,体育赛事这些信息的桥梁。之后更进一步开始了从内置好的服务里,为用户提供门票,影票,餐厅旅店预定的服务。当然,谷歌(微博)也不甘落后,随即也推出了相应的服务于苹果展开竞争。谷歌利用自己业内领先的技术手段推出了超越Siri功能的应用,那就是通过收集用户信息,提前预估用户希望搜索的问题,并供答案。现在,苹果正在从亚马逊挖墙脚,希望通过新鲜的血液来完善苹果服务,随之可能会迎来一场管理重组。
Siri现在面临着两大问题:服务器薄弱,反应迟钝。而这两点都需要苹果加以重点关注。
速度和可靠性
对于Siri来说,自它发布之日起就面临着一个很大的问题,时至今日,这个问题仍然存在,那就是它有时候会罢工,大多数时间它的反应都很迟钝。也许有一部分原因是来自于网络不给力,但是根本原因在于在你得到你想要的回复之前,都要先经历一个过程,首先给Siri发一条指令——你的设备将这个指令发送到苹果服务器进行语法分析——苹果服务器再将分析过后得出的结论发回到你的设备上。这样你就可以理解为什么每次通过Siri搜索信息都会那么缓慢的缘故了。
而谷歌为Android 4.1也提供了声音解析的功能,这个技术应该等同于苹果为iOS 7配备的Siri。将之前提到的这些都在设备上实现,无疑是不平凡的,移除云计算上不必要的负担也同样值得重视,而且益处良多。这样,不仅能提供提醒服务,所有应用里的本地数据都能够使用。例如,体育比赛赛果、电影名单、学科知识、饭店预订等……
基础设施
苹果的服务器端基础设施就是他们的死穴,Siri就是个最好的例子。Game Center已经臭名昭著了,iMessage也一直不稳定,还有App Store(事实上,在我写这篇文章的时候App Store的下载仍处于瘫痪状态),iOS 6地图也一直被人诟病,还有苹果在线商店……
那些来自对手的云服务如谷歌、Facebook,还有亚马逊所使用的服务器都不像苹果过去的WebObjects那么古老。如果苹果重建他们的后台架构,让它能先进一些,或者更先进一些,就像Google Facebook那样,那么亚马逊将微不足道。看看微软自我救赎的转型之路,虽然有些迟缓,也并不能说大获成功,但是最起码让这个之前境遇很是尴尬的行业霸主见到了一线生机。
也许苹果已经开始这么做了,它们缓慢而坚定的推动基于自己开发平台的编程语言Objective-C,对于云计算基础设施也许它们也在做着同样的事,也许事情会往好的方面发展,就像在Mac和iOS上运行的那样。当然,如果苹果的计划不成功的话,数十亿美元的花费也不会白白浪费,只不过不会再单独支持数据中心了而已。但是在下一代的软件中,还是会运用到它们的。
目前谷歌、Facebook和亚马逊都在大量购买APP、开发人员和设计师,目的就是为了填补自己在文化上的弱势。而Sofa、Sparrow、Snapseed等团队也正在努力工作,为的就是在自己发布新一代原生应用的时候不会像过去那么尴尬。它们的努力也初见成效。
苹果还有着一个更难解决的问题,但是这只是意味着苹果需要更加努力的去解决它而已。苹果是收购Nuance或是购买前苹果OS X 主管伯特兰德·赛尔莱特(Bertrand Serlet)的产品,亦或是从Google、Facebook和亚马逊处挖墙脚,无轮那种手段都可以,只要能解决问题就行。否则苹果自己的Game Center、App Store、iTunes、iMessage、iCloud,当然还有Siri都会很遭罪。
API
虽然对于苹果来说,工程师的结构十分重要,但是对于开发商来说他们会更加关注API。自Siri第一次出现的那日起,开发商们就将目光紧紧的盯住了Siri的API,可是让苹果开放Siri的API好像不太可能的样子。
有用户认为苹果目前还不会为Siri内置SPI,因为对于像Siri这样一个人工智能系统来说如果内置插件,那必须是一款绝对值得信赖的插件。那么如何编辑API来判断成百上千款插件是否可靠呢?
还有在第一阶段调试程序的时候如何处理越区冲突,不同的app有可能提供重叠知识源,那么Siri的AI就必须尝试算出针对不同的应用在不同的时候给予不同支持。目前,Siri已经可以针对具有明显区别的需求给出针对性的联系人和地址信息。但是Siri还有很大的发展空间,因为优秀的自然语言解析能够区分细微的差别。
Siri API不会存在于app冲突的潜在可能,但是与苹果的合作协议就不好说了。这就又回到苹果将Siri作为搜索媒介的定位来看了。苹果与Yelp、OpenTable或者是像Fandango这样的应用之间的内容协议有什么价值?如果这些应用想与API免费捆绑怎么办?目前看来,苹果像想运营Apple TV那样来运营Siri(通过关闭合作协议,而不是发放存取)。
对于研发人员来说,这是一个糟糕透了的决定,不过对于用户来说也许没那么糟糕。而且苹果似乎也觉得控制存取会提供更好,更健康的体验,尽管许多高级用户并不认同这一点——看看经典的“冲突”出现了!
无论如何,在我看来,提高Siri的速度和可靠性,修复iCloud的后端基础设施,以及增加预测功能都将是苹果公司要为Siri API完成的。
功能
除去速度、可靠性、系统结构以及API等我们上面提到过的东西,对于最终用户来说,Siri仍然是一个好坏掺半的产品。即使苹果内置的应用也是大同小异。比如,Siri可以编写电子邮件和短信,但是却只能读接收到的短信,不能读电子邮件。
虽然Siri能以人的思维去思考和反应告诉你答案,但是并不意味着它能够完全像私人助理一样帮你完成所有的基础工作。而且有一些很基本的功能并不是Siri不能实现,只是还没有付诸行动。一年过后,Siri仍然没有给用户提供这些基本设置切换功能。
Kontra在Counternotions网站上发表过一篇文章,质疑Siri到底是不是Apple的未来。文中指出Siri针对语境的理解已经超越了谷歌传统的,规则明确、线性的、基本没有语境的文字搜索。
以下为原文摘录:
人们将 Siri 和谷歌比较是理所当然的,也确实有不少乐趣。但这种比较并不合适。Siri 在文字输入的搜索上很难打败谷歌(当然,Bing 和 Facebook 也很难),因为后者已经花了十年时间用各种复杂和高超的算法去微调搜索结果,并建构了庞大的基础设施。但谷歌搜索也有其致命弱点:你必须把你的意图告诉谷歌,并指导它如何构建并返回搜索结果。这对于竞争者是个机会。假设你想在麻省的 Quincy 找一间预算在 25 到 85 美元之间的素食餐厅,而你的谷歌搜索功力十分深厚。那么你会手动输入一串非常具体的字串:“麻省 Quincy 素食餐厅,25 到 85 元”。即便如此,你还是会收到“找到约 147,000 条结果(用时 0.44 秒)”,你还是得从中滤出自己想要的信息。(以下例子都经过了高度简化)
这是一套“由人工指引的导航系统”。它的导航环境是全球所有数据的集合,即整个互联网。用户基本上要一个一个词地主动将自己的意图告知谷歌,后者则一个一个地从这个全球集合里的数十亿张“网页”中缩小范围,最终,用户会从这个大大缩小了的范围中挑出自己想要的答案。
我们来仔细对比一下。假如你跟 Siri 说:
提醒我到公司时在某某餐厅为妈妈的生日订位,然后把开去她家的最佳路线发邮件给我。
Siri 已经可以整合通讯录、日历、GPS、geofencing、地图、交通状况数据、电邮、Yelp 和 Open Table 这些 app 和服务,这足够完成上述任务了。谷歌那样的纯文字搜索只能完成一部分,而且必须靠用户输入一堆关键字,并进行各种调整。现在我们试试把“某某餐厅”换成“好点的亚洲餐厅”:
提醒我到公司时在一家好点的亚洲餐厅为妈妈的生日订位,然后把开去她家的最佳路线发邮件给我。
“亚洲”没什么难度,因为所有跟餐厅有关的互联网服务多少都会把餐馆按照菜系来分类。但“好点的”又怎么说?在这个语境里“好点的”是什么意思?
谷歌这样的传统搜索引擎会直接了当从可供搜索的餐厅评价(这是他们收购 Zagat 的目的)中寻找“好点的”这个字串,它甚至可能会再进一步,做一个“好点的 +(浪漫 或 生日 或 庆祝)”这种综合搜索,以便尽量找出相关的关键词。但我们没法在无限多的领域里去微调搜索关键字,所以上述综合搜索往往发生在金融、旅游、数码产品、汽车等领域。换句话说,如果你搜的是机票或酒店,可供选择的相关词语是有限的,而且谷歌比较清楚地了解它们的意思。如果你要搜的是剪羊毛或“吐橄榄核大赛”,细致的人工分类整理工作恐怕也帮不上什么忙。
不过,就算传统搜索引擎能将“好点的”和“浪漫”或“舒适”关联在一起,从而更好地为你选出一家亚洲餐厅,你还得考虑钱包的问题。谷歌看不到你的银行账户记录,也不知道你平日的餐饮预算与消费习惯。因此,要想搜出真正有用的餐厅推荐的话,设定一个价格区间是必要的,例如从¥¥到¥¥¥,但不超过¥¥¥¥。
像谷歌这样的传统搜索引擎如果要建构你的购买习惯模型,就必须事无巨细地监视你的点击习惯,从而追踪你的交易记录。这种监视会详细到用户不可接受的程度。这一点也不简单(在很多国家大概也不合法),尤其是如果你没有在用 Google Play 或 Google Wallet 的话。所以,谷歌看不到你的信用卡记录与银行账户清单,但 Amex 或 Chase 这样的 app 有这些数据。如果你允许 Siri 以某种加密的方式与你 iPhone 上的这些 app 通讯的话,你就是在发出一种高度选择性的请求,并且表示你信任苹果和 Siri。这样一来,Siri 或是那些 app(有时是两者一起)就能在你的预算范围内来定义“好点的”了:不超过 85 元,150 到 250 那种的绝对不要,但也不要是那种人均 25 元的寒碜的中餐馆,因为那是令堂的生日。
说到令堂,别忘了你的通讯录里她的名字下面,紧挨着“生日”的地方有一个自定义的字段叫“食物”,里面写着:“亚洲”、“牛排”、“印度有机白茶”。另一方面,你在 Yelp 里收藏了 37 家餐厅,无一例外都是素食──谷歌可不知道这个。你妈妈无所谓,但你是不碰肉食的。这时,Siri 可以通过比对两人的喜好来给出双方都能接受的选择。
因此,由于 Siri 了解──在你主动提出要求的前提下──你和你妈妈的口味,以及你的经济能力,一次简单的搜索从“某某餐厅”变成了“一家我能吃得起的好点的亚洲素食餐厅”。
虽然谷歌在iOS上的搜索应用已经很优秀了,无论是从速度还是从可靠性等方面来说都很不错,而且它也在积极的效仿Siri,可是它最大的问题是仍然局限于谷歌传统的搜索模式。
但是Google Now就不再是老样子了,在我的经验里,Google Now虽然在语境的理解上并不如Siri,可是它也提供了一些Siri目前还不太愿意去尝试的东西,例如预测反应。
关于预测的概念并不是谷歌最先提出来的。当高地风险投资公司(Elevation Partners)还拥有Palm的时候董事总经理/联合创始人Roger McNamee就提出过这个想法。“你的手机可以做到:知晓你现在正在什么位置,需要处理那些安排计划,你的联系人有哪些;还能在交通堵塞的时候提提醒你不能按时赶到目的地,是否需要给即将见面的人发一条致歉的短信,告诉他人自己会晚到。从而取代传统静态的报警服务。”
就比如说天气预报吧,平时当你查询的时候你可能会得到雨雪信息预测和提醒你是否加衣等等信息,但是如果采用了预测服务,那么它除了做到以上的这些之外还会提供其它一些它认为你会用得上的信息……
Google Now现在已经在做这些事情了,并且还设计了一个漂亮的界面。虽然Siri在个人化检索方面要优于Google,但是Google也在预测检索方面给苹果还以颜色。除非我们等到2013年秋季苹果发布iOS 7的时候看到Siri的表现,否则在现阶段来说,Google绝对是一个强有力的竞争对手。
底线
无论是Apple II的命令行,或者是Mac的图形用户界面,还是iPhone的触屏,苹果始终处于现代主流计算机界面的前沿。Siri并不是上述这些设备的附属品,Siri就是Apple I,就是Lisa(Apple Lisa是全球首款采用图形用户界面(GUI)和鼠标的个人电脑),就是在iPhone前就夭折了的Safari Pad!苹果需要Siri,否则就意味着它的Apple II、Mac和iPhone要放弃下一个伟大的界面,然后和Google Now或者是微软的Kinect这类产品决战。服务从来都不是苹果公司的强项,所以只能依靠未来的改革来提高自己的竞争力。不然之后的市场竞争对于苹果来说将会很难熬。