近日,Google Assistant(谷歌助理)发布更新,用户可以在Siri中加入快捷设置,比如录下一个“Ok Google”的短语,这样谷歌应用程序就会打开等待用户的指令。

语音交互很“鸡肋”?未来某天它可能成为第一交互方式-最极客

Google Assistant集语音识别、人工智能、自然语音理解为一体,能够应用在手机、手表等各种智能设备当中。当然研究语音交互技术的巨头不只谷歌一家,苹果的Siri、亚马逊的Alexa、微软的“小娜”都为人们所熟知。而在中国,华为、小米、阿里的语音技术和产品也越来越普及,腾讯则推出了智能语音助手“腾讯叮当”,甚至连中移动也推出了语音助手“咪咕灵犀”。

然而语音交互技术在发展的同时也不可避免地显现出缺陷,甚至有观点认为这个技术很“鸡肋”,但是如此多的巨头都看好语音交互,并且在这一领域各展所长,还有一些应用已经落地,很大程度上推动了语音交互技术的发展。那么巨头们在一个“鸡肋”的领域努力值得吗?人们真的需要语音交互这种方式吗?语音交互领域又是否有更广阔的前景呢?

一、谷歌领跑,科技巨头加快布局语音交互技术

要说在语音交互领域哪家公司走得最远,谷歌绝对当之无愧。

在去年的发布会中,除了发布Pixel手机之外,谷歌的另一个重磅产品就是Google Assistant。相比于此前的6.X时代,7.X中的语音助手不只囿于简单的问答形式,而是更加注重对信息的整合能力,可以凭着调用系统中更多的权限实现更为智能化的信息展示。

语音交互很“鸡肋”?未来某天它可能成为第一交互方式-最极客

在发布会中,谷歌展示了Google Assistant全新的信息整合能力,通过读取用户的社交网络信息给用户提供导航与社交网络评价等内容信息,让所有的内容更为立体,并贴近真实的用户体验。此后Google Assistant就成为了谷歌硬件产品的基础应用,谷歌的手机和所有的家庭设备都成了第一批支持这一功能的硬件产品。

此外谷歌还希望将语音助手变成人类与智能硬件交互的重要方式,用户可以通过语音来预订餐厅、播放音乐、查看照片等等,而不必再去屏幕中点击或扫描。当然这并不是很新的技术,因为此前苹果的Siri、微软的“小娜”等许多语音助手已经能够实现这些,但谷歌的愿景是将它变得更好,好到用户会频繁地使用这项技术。

这样的话从谷歌这里说出来并不存在违和感。支撑语音交互的主要技术就是AI,当AI愈发被重视,如何连结所有的AI服务,并让这些服务自然地出现在用户有需求的场景中,同时搜集反馈数据也就随之成为一个重要的问题,因而语音助手成为了许多科技公司青睐的方式。

想让AI好到极度实用的程度,通过大量数据来训练机器的学习算法是必不可少的步骤,而大数据恰好是谷歌的专长。Google Assistant结合了谷歌积累多年的大数据、机器学习、语音识别以及自然语义分析等技术,甚至超越了谷歌10年的技术积累。

用户真正想要的语音交互方式是怎样的?此前Siri和“小娜”的尝试其实都非常典型,即基于已有数据库与搜索结果的简单问答模式,以及基于用户以往的搜索习惯的预测模式。但是看看大家这些年对语音交互方式的吐槽不难发现,对于真正渗透进人们的生活之中这件事,此前的尝试还不算成功。不过之后亚马逊Alexa“后来居上”的事例却透露出了一个重要信息:用户希望语音交互技术更倾向于“辅助”功能,而非与它们做“朋友”,这意味着任务导向型的语音交互模式是较为合理的。

语音交互很“鸡肋”?未来某天它可能成为第一交互方式-最极客

Google Assistant的负责人Gummi Hafsteinsson认为,Google Assistant的定位就是时刻陪伴用户,并且不刻意地出现在用户的生活之中。例如家里需要购买某件物品之时就可以用语音命令Gummi Hafsteinsson在网络中购物,而无需放下手头的事情,所以Google Assistant存在的意义是辅助用户,而非让用户专程去“调戏”它。实际上现在有一些智能手机上的语音助手和智能音箱产品就走入了让用户‘调戏’的状态,虽然这样的人机交互也不乏乐趣,但这不应该是语音交互追求的终极目的。

可以看到,谷歌深耕语音交互领域的优势在于技术,凭借这一优势谷歌很可能成为语音交互技术方面的推动者甚至领跑者。不过在行业中生存的巨头都是各有招数,其他的公司或许没有谷歌这样强大的技术优势,但凭借其他的本领也能在语音交互领域占据一席之地。

例如苹果、华为、小米这些公司也在语音交互领域发力,它们主要凭借的是智能手机出货量的优势。苹果自不必说,其江湖地位早已奠定,Siri助手也随iPhone普及。虽然Siri助手停留在语音交互的初级模式,但苹果强悍的出货量依然让Siri成为了最受欢迎的语音助手。华为手机在近年来的表现也是愈加优秀,出货量一度超过苹果,其语音助手甚至已经开始进军海外市场。小米的生态链产品本就丰富,语音助手更是一个极佳的入口,小米的语音助手“小爱”已经和超过1亿台的IOT智能设备联动,累计唤醒次数超过50亿次并且还在不断上涨。

可以看到,科技互联网巨头们对语音交互领域兴致盎然,并且在努力地进行技术的研究与产品的生产,在生活中也可以看到越来越多的人倾向于使用语音交互技术。但现在还有观点认为语音交互会成为“鸡肋”,而且这种声音还不在少数,那么巨头们在一个可能沦为“鸡肋”的领域下这么大的功夫真的值得吗?

二、语音交互技术竞争背后是新技术的全面较量

在深耕语音交互领域之前,巨头们一定是经过深思熟虑的。

无论是PC时代的键鼠交互模式,还是移动互联网时代以触屏为主的人机交互模式,都偏向于传统的输入输出模式。而语音交互的方式则颠覆了这一传统,其中还涵盖了AI、大数据、深度学习等诸多技术,所以从表面上来看巨头们是在抢占语音交互市场,其背后却是AI等新技术的较量,这些技术对于科技公司的意义无疑是巨大的。

语音交互很“鸡肋”?未来某天它可能成为第一交互方式-最极客

其实做AI语音交互最为重要的就是让它“像人”,这是深度学习的能力层面的问题,体现在表现形式方面就是要注重“话术”。为此,许多公司专门组建了“性格团队”,赋予语音助手独特的性格,再将其通过声音体现出来,这也就是语音交互的“人格化”。例如谷歌内部就有一个专门负责开发语音助手会话与人格设计的部门,他们的目的就是让语音助手拥有近似人类的表达方式,而亚马逊也表示其语音助手Alexa在声音上能反应出企业“聪明、谦卑、时而搞笑”的价值观。

语音交互的“人格化”应该算是一个标志性的转变,让语音交互模式有了一个质的飞跃,也让本就存在的用户需求变得更为强烈。

语音交互的人格化是很符合现代人需求的。在高速运转的现代社会,人类愈发孤独,缺乏恋爱和社交的精力和勇气。但人在本质上需要交流,而如今的社会形态和发展速度让忙碌的人们很难实现这一点,这就让人们越来越倾向于在虚拟的世界中找到精神寄托。所以人格化的语音助手对于人类而言不仅能够成为精神寄托,也能够让人类与生俱来的惰性更好地得到满足。并且在下一阶段,语音助手能够实现与人类的情感互动,这就更加满足了人类在心理和情感层面的需求。即使目前还没有到达这种程度,语音助手的辅助功能也能够帮助忙碌的人类节省出许多时间,满足人们对于效率的需求。

另外,人口老龄化的问题在不少国家和地区都已相当严峻。对于老人而言,想要熟练使用智能硬件是十分困难的,在我们看来简单无比的操作对他们而言却是很难迈过的一道门槛,甚至前段时间还有人以漫画的形式教父母和爷爷奶奶上网。而语音交互方式对于老人来说绝对是最好的手段,在对Siri的一项调查中就发现语音助手使用量最高的是55岁以上的老龄组,对于视觉障碍人群而言也同样如此。一旦这些群体得以开发,带来的利润也将十分可观。由此可见,语音交互技术未来的前景还是相当可观的。

三、语音交互有望成为第一交互方式

尽管现在的主流交互方式还是键鼠和触屏,已经出现语音交互方式取代传统交互方式的趋势了。事实上在生活中,我们已经越来越多地在使用语音交互方式。在开车的时候,我们越来越习惯通过语音给智能手机或系统下达各项指令,语音助手对我们的命令也有一个良好的完成度。在日常生活中逐渐普及的智能音箱也为越来越多的人所喜爱。随着技术的发展,语音交互的方式还会渗透到更多的设备中。

语音交互很“鸡肋”?未来某天它可能成为第一交互方式-最极客

我们已经在被语音交互的方式所影响并且在不知不觉中加入,只是我们还不自知而已,因为不是所有的变化都能很容易地被察觉。可以确定的是,未来人类会在更加丰富的场景中运用到语音交互技术,语音交互会有更广阔的市场。这样看来,语音交互不仅不会成为“鸡肋”,相反还可能会成为未来的第一交互方式。