下一个人机界面会是什么呢?谁将会取代键盘和触控屏呢?《大西洋》(Atlantic)近日发布文章对此进行了深度解析,称计算机的问题在于,它仍然是人类与他们想要做的事情之间的中介者,增强现实未来或许可以将计算机剔除在外,产生下一个重要的界面。不过,有的专家还有要激进得多的想法:开发界面来支持大脑与计算机之间的直接通讯。
以下是文章主要内容:
电脑键盘对于正在使用它的人来说并不显眼。它设计得为人所感知,产生的声音被人听见,但大多时候它的存在都不会引起注意。一旦你习惯使用它了,你通常都不会将注意力放在你所按的按键或者那些按键所产生的咔嗒声上。相反,你是沉浸于电脑屏幕上出现的东西。
从这方面来看,技术一直以来都是扮演中介者的角色,通过它人类能够与他们的环境产生关联。最早期,当人类能利用身体来完成工作时,他们开发了工具,让它们来帮忙完成那些事情,如斧头、锤子和皮带轮。一千年来,机器变得能够处理越来越复杂的体力劳动,而人类仍要承担大部分的信息处理工作。在上一世纪,这一点发生了巨大的变化。
由于计算机能够处理诸如密码破译、复杂运算的任务,该平衡发生了变化。可处理数据的机器需要比简单的杠杆或者车轮复杂得多的界面。不过,同样的在信息任务上带来全新人机协作方式的界面也会受到其自身设计的制约。
信息处理问题
“这催生了信息处理问题。”美国国家自适应神经技术中心副主任格文·沙尔克(Gerwin Schalk)表示,“忽然之间,在我们与环境的交互中,并不只有人和某种工具了,当中还有某样东西——它就是计算机。”
在沙尔克看来,问题在于,人类和计算机能够做的事情要远远多于横在二者之间的界面允许他们做的事情。
“计算机非常快速,它们非常先进,它们能够在刹那之间处理海量复杂的数据。”他说,“人类则很擅长其它的事情。对于某个场景,他们能够一眼就看出正在发生什么事情。他们能够建立起复杂的关系。现在出现的问题是通讯问题。所以根本性的问题在于,极其强大复杂的人类要如何与日益复杂能干的环境进行交互?机器人非常复杂,计算机非常复杂,我们的手机也非常复杂。”
在技术史的当前阶段,界面设计的目的是使得计算机能够在人类感知运动系统的界限内做尽可能多的事情。鉴于众人使用电脑的目的,这一安排非常合理。大多时候,人们是用电脑来浏览资讯,编写文本,或者看照片视频。“就那一点而言,键盘和鼠标——还有触控板,以及由于可靠性相对不足而不那么普遍的语音控制——仍然很便宜,很适合处理那些任务。”机器人专家、Mayfield Robotics首席技术官Kaijen Hsiao指出。但对于其他人来说,传统的界面其实并不足够。
“如果我想要给计算机解释我大脑中的某个复杂的计划、意图或者看法,我们无能为力。”沙尔克说道。
简单来说,这是一个比人际沟通更有挑战性的沟通问题——它本身就很复杂,且有多面性。人际沟通中通常都会伴随某种程度的语言转换。而与机器沟通所需的额外步骤则极其麻烦。
“当你试图向计算机或者机器人解释同一件事情时,你得将大脑中的鲜活意象转化成符合语法和语义学的语言,这一过程已经丧失了很多的鲜活性和语境。”沙尔克说道,“之后,你将那些语言转化成手指运动,通过计算机键盘输入那些句子。认真想想,你就知道这有多荒谬。”
从实践层面来看,对于大多数人说,这种荒谬是不存在的。毕竟,要编写邮件,你得使用键盘来输入内容。
“然而,如果你站在很高的层面来思考相比以往我们与环境的交互已经变得有多可悲,你就能发现问题所在,事实上该问题还可以量化。”沙尔克指出,“任何形式的人类交流速度都不超过每秒钟50拍——不管是口头交流还是敲字交流。那基本上就是人类给外部技术设备传输信息的最快速度。每秒50拍可以说远远不够,简直是可悲。想想计算机和大脑每秒钟能够内部处理多少GB的数据,就知道这是何等量级的错配啊。”
微妙的通讯形式
随着机器变得越来越先进,这种错配会变得愈发明显。数位机器人专家称,要是没能改进现有的界面,那么人类最终将无法在机器学习、人工智能等领域取得进展。“随着语音识别、自然语言处理、脸部识别等技术变得越来越出色,我们与机器的通讯应当能够超越屏幕,包含部分我们用来与其他人互动的较为微妙的通讯形式。”在麻省理工学院研究人机交互的凯特·达林(Kate Darling)指出,“如果我们希望机器能够模拟人类的情感状态,那么让它通过音调、活动及其它线索表达出来,它的能力就会得到更加完整的表现。”
这种线索必须要成为整个流畅交互过程的一部分。举例来说,要保证能够给与飞行员共事或者在手术室与医生共事的机器人打造微妙的通讯形式——在那些场景中,人类需要能够预测机器人要做什么,同时还得将注意力集中在他们自己在做的事情上。“人们会在各种场合与机器人共事,他们需要知道机器人的下一步行动。”杜克大学机器人实验室主任米西·卡明斯(Missy Cummings)指出,“跟其他人一块时,我们会利用我们的周边视觉来观察他们的细微动作,从而推断出他们的行动,而机器人则不能像人类那样流畅行动。因此,我们必须要知道该如何理解更加细微的交互,比如通过结合利用光和声。”
在一些场景中,如人在驾驶,需要注意路况的时候,语音通讯仍然是最好的交互界面。“当然,语音通讯的问题在于,语音识别系统还不够出色。”卡明斯说道,“我不知道语音识别系统未来能不能达到识别语境的程度。语境可以说是对话的艺术。”
目前已经有公司在大力改进基于语音的界面,像Siri这样的数字助手和像亚马逊Echo这样的智能设备将会在人们的日常生活中扮演越来越重要的角色。与此同时,其它的中介型界面也很可能将迎来改进。
增强现实和虚拟现实
触控屏在某种程度上已经获得了改进。该界面曾在很长一段时间里被认为对于流行设备毫无价值,因为该技术不够出色。“触控屏按钮?”2007年iPhone推出时有人在Engadget网站上评论道,“坏主意,这玩意永远都会行不通。”(沙尔克认为iPhone是人机交互“意义深远的进步”,但也只算是“缓解策略”。)不过,到目前为止,其它的界面——语音控制、手写数字转换器、运动控制等等——都还没真正实现腾飞。
很多技术专家认为,增强现实和虚拟现实的兴起将会产生下一个重要的界面。但有数位工程师和学者指出,这样的跃进将需要目前还未出现的技术进步。
一方面,时下最先进的混合现实平台在实时绘制用户所在的现实世界方面都不够精确。也就是说,该类系统便于将网页或者其它的虚拟元素投射到你所在房间的墙壁上,但它们还远未能够做些足够革命性的事情来彻底改变人类思考人机交互的方式。
对于开发者来说,这些系统的关键问题之一在于,理解非虚拟世界在不同时候对人类的重要程度。换言之,你周围的现实世界需要变得可见吗?多大程度上需要变得可见?乔治亚理工学院交互式计算教授布莱尔·麦金泰尔(Blair MacIntyre)举例说道,对于电话会议,使用增强现实要比虚拟现实好得多。“你肯定不只是想要电话会议的虚拟现实版本,因为我可能需要看看我的笔记,或者在电脑上输入信息,又或者需要小心拿起我的咖啡杯,避免将其弄翻。”
麦金泰尔喜欢将这一问题称作“喝啤酒问题”,即你在玩视频游戏时会需要停下来喝口啤酒。“在虚拟现实中,那不容易做到。”他说,“但在增强现实中,那就好办点。”他认为,最终,增强现实将能够追踪较小的物体,扩增现实世界中较小的东西,这会使得它的应用程序和界面变得更加先进。显示屏将会变得更加清晰。例如,在机场查看航班信息,会意味着利用混合现实来在你眼前查阅信息,而不是通
本文来源:不详 作者:佚名