毛毛思雨小站 诗之韵

缔造百度AI首款硬件的DuerOS 2.0,如何抢位语音人机交互时代?

流量入口之争,向来是巨头必争之地。

遥想当年,iPhone触摸屏异军突起,开启了波澜壮阔的智能手机触摸屏时代,缔造了今日数千亿市值的苹果帝国。

今日,AI时代强敌环伺,2014年亚马逊率先凭借Echo占据对终端智能流量入口的绝对把控。放眼中国市场,虽有各家智能音箱“百箱大战”,却未曾见有一家能够统摄终端入口江湖。未来语音人机交互必将成为主流交互方式,在格局待定之时,巨头也好,创业公司也罢都在纷纷加码。 

昨日百度世界大会,密集刷爆了科技界眼球,更是有「硬」货推出。百度的渡鸦团队首次发布了自收购以来的AI硬件产品,分别是:raven H 、raven R 和raven Q三款产品,涉及到娱乐、智能家居多种场景。


  渡鸦raven R

百度「软硬兼施」,生态、产品两不误

显然,一直忙着做AI生态的百度,在智能音箱产品上,入局就显得稍晚了。晚则晚矣,是不是在产品和体验上更胜一筹是大家所关注的。渡鸦吕骋在大会现场表示,如果说iPhone是移动互联网时代的定义性产品,那么百度想做人工智能时代的定义性产品,而这几款硬件背后均搭载了DuerOS 2.0的技术。

7月百度AI开发者大会上,百度度秘事业部总经理景鲲发布了DuerOS 1.0版本,表示要“唤醒万物”,做人工智能时代的安卓。四个月时间,DuerOS的成绩单已经出来:新增130余家合作伙伴、落地硬件解决方案超过20个、每月新增5款以上搭载DuerOS的设备。

缔造百度AI首款硬件的DuerOS 2.0,如何抢位语音人机交互时代?

百度度秘事业部总经理景鲲

这次,DuerOS全面升级2.0版本,全面更新了小度智能设备开放平台的输出模式,并且全面开放了全新的小度技能开放平台。 无论是在技术能力、解决方案、还是平台体系上,都有较大升级。

李彦宏在大会现场通过手机百度,在语音播报信息流内容时,用自然语言交互进行播报控制及深度信息挖掘的体验展示,正是基于DuerOS2.0提供的语音交互APP解决方案,甚至是无需唤醒词就可以实现自然语言的交流对话。

“DuerOS要成为世界级人机交互的标杆。“景鲲在对话式AI分论坛现场表示。

这次百度世界大会的主题口号是“Bring AI to Life”,其AI的产品落地以及商业化成为外界关注的焦点。不难看出,不管是从形式上,这次大会下午设立了5个分论坛,其中AI线条的就占到了三个,还是从实际听会的感受上,百度内部的各部门之间都在做业务的整合、连接,新兴AI部门和传统业务部门的融合,陆奇加入之后,整合力度可见一斑。 

而从产业结构的逻辑上看,DuerOS的升级很可能是众多AI业务线索中能够串联起整体,并且快速推进百度开发者生态,连接商业能力的一环。

而无论是技术层面,还是商业角度的验证,语音交互市场都已经在被全面激活。

「把用户体验做好」成为景鲲口中说得最多的话

会后,36氪等媒体专访了景鲲,深入探讨了DuerOS 2.0的技术迭代、商业应用以及未来语音交互的市场。 

未来,语音人机交互将成为主流交互方式,但现实的情况好像并不乐观。景鲲对此表示,“任何一代新的交互出现的时候,用户都不是立马就转变。都是有使用习惯的,从原来的键盘、鼠标,到后来的触摸屏,电阻屏,电容屏,但是都在慢慢产生影响。”

在他看来,整个智能手机的普及,是随着iPhone4在中国出现,才开始产生真正大规模的普及。这个时候,需要给这个产业一点耐心。语音交互在汽车、家庭等场景下都是非常自然的交互,“这样的变革往往需要更多资源和资本的力量来推动。”景鲲说到。


景鲲接受媒体专访

而如何让用户接受,景鲲认为整体的体验效果是非常重要的。整个语音交互的体验,不止是语音交互的唤醒,而是对整个产品的颜值、声音,一套端到端的体验,各个细节都需要打磨的非常好。

从反馈的数字来看,很多数据都是正向的,有不少用户能够从一开始的新奇都之后每天在固定场景的使用,正逐渐接受这种新的交互方式,这让他们备受鼓舞。

而整体用户的体验,也是DuerOS要做AI时代的安卓,生态系统方面考虑的一个重要环节。景鲲表示:“合作伙伴变多之后,比较担心能否保证每台设备都能有比较好的一致性的用户体验。我希望每个场景下搭载DuerOS的设备都能有不错的体验,让大家经常使用。生态系统必须要靠比较好的体验才能往前推。”

在第三方合作的厂商中,他们更加关注“听懂”和“满足”这两个方面,“听懂”是技术上的需求,目前市面上有很多智能音箱表现的有点“傻”,和它对话就比较费劲,因此“听懂”涉及到自然语言的理解和处理,也是人工智能时代非常大的一个难题,但却正是用户所关心的问题。“满足”则更多是资源上的需求。

既然渡鸦被称为DuerOS 标杆性产品,用户体验的突破在哪里?

景鲲表示,渡鸦除产品本身的特性之外,跟DuerOS相关的技术包括,比如渡鸦的麦克风阵列,它用了8个麦克风,上面盖子4个,下面底座4个。“像这种新的麦克风阵列技术,基本上现在应该是业内首家尝试的。”景鲲说到。

景鲲继续介绍,渡鸦设备上面的盖子拿下来之后,是可以按住说话的,从语音技术上而言是属于近场交互,所以说这是一个远场和近场融合的交互方式,这跟它的设备特性相关。


  渡鸦raven H和raven R

在对音乐的打磨上,把基本音乐升级之后,对整个音乐标签做得更多了,做了7千多个应用标签,让用户在这种智能设备上,可以播任何一个标签的音乐。

此外DuerOS 具备100多个第三方技能,这些技能也会跟渡鸦设备做紧密结合。据介绍,在渡鸦这款智能音箱上,什么时间段做什么样的交互,有无应答指示灯,什么样的声音特点,和人交互回复的时间间隔长短,都花费了大量时间打磨。

景鲲认为,“渡鸦的整个产品特性是软硬一体化的,是全面的融合。从设计到声音,到我们的技术能力,到后面的内容,整个包装成一个用户体验很好的产品。”

从百度AI开发者大会到现在,景鲲说到,“这4个月是突飞猛进的4个月,我没想到这4个月变得这么热闹。”他表示从7月5日发布DuerOS平台之后,基本上中国很多公司都推出了类似的东西。“这4个月的发展我觉得很好,从我的角度,我觉得特别高兴。我们作为驱动,有很多不同的人、不同的公司都加入到这个过程中,推动这种变革。”

在景鲲看来,人机交互真正的变革时间会比较长,不能心急,光这4个月还不够,可能要以年来计。现在所有的公司可能都处在起步阶段,也正有很多公司在加入这个行业。

“我希望整个行业都能保持这种热情,把这种人机交互再持续往前推,推到每个家庭,它会是一个必需品。”景鲲说到。


2017-11-18 | 发布:mjtmjtjj | 分类:科技创新 | 评论:0

发表留言: