都市人的生活正在越来越多地和汽车发生着关联,驾驶着汽车的同时,是否可以处理更多的事情?车载系统中的人机交互设备,还能提供更多的可能性吗?日前,中国后市场车联网高峰论坛telematics china上,记者采访了深圳市车音网科技有限公司副总裁陆凌涛和FaceUI设计总监朱佳明,两位就车载系统中的人机交互等备受关注的话题对谈,碰撞出充满想象力的火花。
语音交流是最自然的方式
生活中,我们使用语言和别人进行交流产生互动,科幻大片中,我们看到主人公和高智能的机器人直接直接用语言进行交流。电影中的画面是否可以在生活中出现?当语音识别系统被使用到车载设备中,科幻片中的场景也许可以在你和你的爱车之间实现。
在陆凌涛看来,语音识别其实被忽略了很多年,“语音识别在我看来是人类最自然的交互方式。人与人面对面的时候,我不会写一纸条给你,我会跟你说话。我们公司拍过一个宣传片,说的是一个孩子刚生下来,还没有睁开眼睛看这个世界之前,他会先用哭来宣告自己来到这个世界,父母也会听得懂孩子的哭声是表示饿了、尿了,或者困了等等。这个实际上是一个最基础的语音识别。”
不过,落实到具体的操作中,语音识别本身并不完全是语音识别,它还包括语音、语义和智能化,这就意味着,完成一次交互问答的过程,需要语音识别、人工智能等等多项技术来支持。以询问天气预报为例,如果跟车载系统讲:“北京明天的天气怎么样?”系统会告诉你北京明天的天气情况,然后你紧接着问:“那上海呢?”这样的表达,对着一个普通的成年人,对方一定是能听明白你想进一步了解上海的天气,但是,纯语音识别的机器是听不懂的,加上语义识别后,它会知道这是跟上句有关系的——你问的是上海的天气。当然在与机器的交互对话中,会需要你反复确认表达的意思。这个过程相对于人与人之间的交流互动,虽然显得有些繁琐,但带来的是信息的精准度。
而在朱佳明看来,“语音交互确实是一个很自然的方式,越自然的东西越让用户感觉到简单、人性化。但是对于交互系统来说,技术上的难度也就越大。从键盘机到触摸屏,一步步的延伸,最终目的是为了判断使用者想要的东西。以前更多是把使用成本交给用户,去点某个键、找某个菜单,现在交给语音。这样的交互系统要如何设计?要基于大数据的挖掘,如何从技术上找到存在的问题或着痛点所在,就显得特别重要。”
给用户以“被关怀”的体验
看过电影《钢铁侠3》的观众肯定记得,片中主人公跟系统的交互全部是使用语音的,他可以一边锻炼身体,一边跟系统说话,让设备帮他处理各种事情。在陆凌涛眼中,这是语音识别另一个被埋藏在深处的价值——能够让人“三心二意”,以提高单位时间的效率。朱佳明则更愿意理解为,“原本的语音交互是人去控制的过程,现在则发展成它能够替你去思考,给人一种被关怀的感觉。” 这种“被关怀”体现在当你想订机票的时,不必自己去上携程网,你的交互系统知道你明天要去哪里,帮你查了有哪些航班,有没有票等等,然后根据你的需要帮你订好机票。
要让《钢铁侠3》里的场景在生活中“再现”给用户以最自在的体验,朱佳明认为从技术层面需要解决的最大难题可能就是语音识别判断的准确性——人和人对话时方言都可能带来交流的障碍,何况是人和机器的语音交流。此外,在使用语音指令的时候,什么时候应该停顿,系统又该如何分析判断这个命令,都是需要在技术层面解决的难题。
“被关怀”的体验还在于安全问题。对于汽车的驾驶者而言,80%的主行为是驾驶这件事,互联网化的思维反映到车载领域会是怎样的?陆凌涛给出了一个特别形象的比方:“比如,系统发现这个路段有个坑,知道前面有撞车事故,或者这里是事故多发地段,就会用各种方法提示你,让你专心驾驶。”
人机交互更进一步就是回归本能
谈到人机交互的发展和未来,陆凌涛认为人机交互的方向就是不断向“人”的一侧偏移。他用语音识别举了例子:最早一代关键词式的语音引擎只能听懂设定好的回答,第二代自然语言可以自动提取回答中的关键词,到了第三代可以理解多句回答并理解上下文关系,甚至可以主动引导人说出机器需要知道的信息。“简单说,就是机器应该学习人,更倾向于像人一样说话,而不是不说人话。”
以人为核心,满足自然需求,人因实际上是技术演进的重要驱动力。就像曾经人们对诺基亚的操作烂熟于心甚至成为业内标准,但是iphone出现后,因为更加符合常规使用习惯的操作很快就颠覆了手机行业,人们很快适应了新的操作和标准。
交互的目标是本能,了解本能是人因研究中的重要问题。朱佳明列举了这其中的意义,比如挖掘用户的使用习惯,不同的使用场景、使用时间,包括不同用户群的背景和使用动机。个性化、用户群划分都需要人因研究的支持。甚至说未来会衍生、拆分出更加细致、垂直的模式和市场,更加回归人类本能的需要和习惯。
本文链接:http://www.mobileui.cn/human-computer-interaction-of-nature-and-instinct.html本文标签: 人机交互, 语音识别