计算已经蔓延到世界的每一个角落,但并不只是意味着屏幕变大或者变小,很快,移动电脑还可能告别屏幕。
Google会话搜索集团主管斯科特-赫夫曼(Scott Huffman)表示:“现在要在汽车上、在西服的翻领上配一个强大的电脑太贵了,从电脑形态来看,未来并非全都配有键盘或者屏幕。”
在Google的产品中,语音命令快速切入。在手机上,Android版Google Now和iPhone上的Google搜索APP已经支持语音搜索。在Google Glass上,如果没有语音互动,眼镜几乎无法使用。Moto X也将语音命令当成宣传重点。
语音与电脑互动并不新鲜。Google的目标是让语音和键盘、触摸屏一样方便容易。就目前来说,让语音界面在个人计算设备上成为主流仍然面临大挑战。
赫夫曼称:“我们希望人们与Google互动就如同和一般人互动一样。”他掏出智能手机问:“这里离赫斯特城堡有多远?”
一般来说,要回答这个简单的问题需要搜索“赫斯特城堡”,点击地图,输入自己的地址。但赫夫曼的手机第一时间就给出正确答案,语音命令可以节省时间和精力。它是电脑界面便捷性自然发展的一部分:10年前,你如果要写一封邮件,你得走到电脑前;5年前你掏出手机就行;未来可能只需要讲话就可以了。
要达到这个目标,Google会话搜索集团的任务就是将目前Google对现实世界所知的一切整合起来。人们学习外语时,一半的困难来自了解语言中包涵的文化,语言是依赖于环境的,这也是会话搜索的挑战。
赫夫曼称:“核心相关性、排序,Google搜索因此而知名,这些优势对我们的工作有帮助。”
感知环境不只会让Google语音界面更好用(某一天),还会让它比人类更好。
赫夫曼称:“今天,自动语音识别没有人好,但我们的目标是让它比人好。”
要达到此目标,就必须利用好掌握的用户信息。
赫夫曼说:“有时,Google拥有的环境信息比一个人类转录员多,比如,我们可以根据手机的地理位置知道你的位置,知道一些你最近谈论的事,它会帮助我们理解你所谈论的东西。”
未来,Google语音界面不只是准确解释指令,它还可以增强现实的互动。比如,让语音界面理解代词的意义。赫夫曼称:“在语音中有许多的代词,之所以如此,是因为它可以让我们更快沟通。”
例如,赫夫曼问“赫斯特城堡离我这里有多远”,然后说“告诉我方向”,里面甚至没有包括代词“它”,但手机开始指出方向了。
在对话中,人类可能会忘了代词代表什么,他会问同事们在谈论什么。Google会话搜索还没达到这种水平,但赫夫曼的团队正在努力。
对于语音控制来说,最大的挑战在于可靠性和错误修正。还有一个挑战在于,现有的视觉电脑接口限制了我们的使用,导致语音难以变得更容易使用。例如,在图型用户界面中,点击按钮、查看菜单就可以找到目标。但用语音控制电脑就如同用老式的命令行控制电脑。语音可能很强大,但需要人类学习全新的控制方式。