“寻找贾维斯”简史
文|脑极体
可能人人都希望自己有个“贾维斯”。
虽然已经退出漫威电影很多年,但是我们还是能够记起那个钢铁侠战衣里无所不能的AI助手。独特的幽默、优雅的语调,以及非常靠谱的人设,让无数科幻迷对这个看不见听得到的角色产生了无尽好感。
对贾维斯的迷恋有多疯狂呢?我见过贾维斯版本的电脑桌面程序,贾维斯模样的手机UI,以及以贾维斯命名的AI算法。设计师和极客们,迄今为止想了无数办法来“复活”属于自己的贾维斯。
然而画面越来越逼真的贾维斯界面,显然无法得到它的精髓:像朋友一样的沟通与陪伴。
假如说有某种技术希望能够在“本质”上寻找贾维斯,那么一定非语音助手莫属。
由于身处一个科技爆炸的年代,日常生活中我们可能不太留心某种技术的发展。但是如果一旦停下来回头看看,会惊奇地发现一门技术原来经历了相当惊人的变化。比如说手机中的语音助手,已经成为了日常生活的一部分。而如果回首一下它的历史,说不定会大吃一惊:原来用语音助手复活贾维斯,并不是说着玩玩的。回看这些年语音助手的成长,会发现在人性化交互、应用能力拓展,以及功能集成上,语音助手的体验确实在一步步逼近“贾维斯”这个终极目标。
最近好像流行写各种简史,那不妨让咱们今天来讲一段,关于“寻找贾维斯”的简史。不难发现,语音助手的进化轨道,其实已经非常清晰明确。
语音助手初长成
大家都知道,最早的语音助手是苹果推出的Siri。
想当年,在大家都没跟手机说过话的时候,Siri小姐姐真的可谓是叱咤江湖。《生活大爆炸》里甚至有一集,专门安排拉杰什和Siri谈了回恋爱。
然而要承认的是,技术必然尤其阶段性。就像老爷车虽然经典,但是肯定无法开上21世纪的高速路。初始阶段的Siri,在今天来体验其实是很初级的。
语音助手这件事,之所以得到了苹果的大规模投入,其实主要是云计算系统的功劳。其实更早时候,语音助手的雏形已经出现。只是当时云计算体系没有铺开,只能把若干语音指令存储在手机中,这导致用户的问答模板过分单调。
而从Siri开始,语音助手完成了云端部署。这样可以在云端存储大量的对应模板,并且实时更新,从而让语音服务成为可能。
这时候的Siri虽然知道的多了,但是智商却十分堪忧。由于当时的语音助手完全是模板化的,换句话说你必须准确说出了问题,并且被Siri准确识别了,才能给你找出对应的答案。
然而套路终归是套路。那个时候,应用Siri的体验大概是这样的:
Siri,帮我给xx打电话
好的,已经拨打
Siri,帮我打个电话,我要联系xx
对不起,Siri没有听懂……
总之就是,模板不能错一点点,否则就是推到重来。好在,这种语音助手完全比拼模板数量的时代,很快就过去了——因为AI来了。
AI来了之后
早期语音助手的最大缺点,在于问答只能模板化。用户实际上不是在跟语音助手聊天,只是把遥控器换成了语音操作而已。这在某种程度反而是增加了用户的交互成本,同时也让用户心中对于“语音助手“这个概念的智能化期待大打折扣。
好在AI来了。
随着深度学习的复兴,以神经网络处理语音任务逐渐成为主流。随着AI加入之后,语音助手开始呈现语义理解、多轮对话,声音合成等能力,并且在这几条轨道上不断发展。于是我们看到了语音助手的听力越来越敏捷,很多情况能够和用户像正常聊天一样说下去。甚至方言、儿童音等问题都得到了一定程度的解决。
这个时期的语音助手,最具特色的代表应该是谷歌语音助手Google Assistant和微软小冰。前者去年曾经创造过模仿真人打电话而不露馅的“壮举“,而后者也常年活跃于聊天界,以不被发现是AI而著称。
这个时候的语音助手体验,已经有了比较明显的升级。比如用户数我想打个电话/帮我打个电话/帮我查一下某人的号码,然后打电话,语音助手基本都能明白。
而且在深度学习的帮助下,语音助手还能记住用户的聊天习惯,时不常还能跟用户逗个闷子,聊天时立个人设。
然而这并不是终点。随着AI语音助手的普及,尤其是在手机中的广泛应用,用户发现它能干的事情还是太少了。基本就停留在打电话、发短信、整理日程表等几种。然而这几种在今天已经是名副其实的边缘应用。
只能聊而没啥用的语音助手,就好像贾维斯只能陪着托尼瞎聊天,却无法启动钢铁侠战衣——这显然是严重影响票房的。
在移动AI觉醒的这两年,随着终端AI处理能力越发强大,事情开始有了更多发展。
从软件到硬件的折叠
版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/52142.html