毛毛思雨小站 诗之韵

语音助手已成趋势,但还不够强大

语音助手已成趋势,但还不够强大

语音助手已成趋势,但还不够强大

编者按:Fraser Allison是墨尔本大学人机交互博士候选人,他最近刊文讨论了语音界面的发展。在过去几年里,语音界面进步很快,理解日常、自然语音的能力大大提升,不再局限于呆板、谨慎的言辞命令。

如果一个包裹出乎意料来到了门口,你也许想和家中的智能设备说几句话。 

最近,美国达拉斯州一个6岁的小孩告诉家里的Echo音箱,让它定一个玩具屋。亚马逊语音助手Alexa遵命照办,真的定了一个。 

圣迭哥电视台报道了此事,新闻节目主持人还评论说:“我真是喜欢这个小女孩,她说:‘Alexa给我定了一个玩具屋。’”听到新闻之后,圣迭哥家庭的许多亚马逊设备也纷纷购买了玩具屋。 

有些人可能曾经尝试苹果Siri、微软Cortana对话,听到这个故事,他们可能会涌起一种熟悉感。虽然设备已经很强大,可以听清我们的命令,但是它们并非总是能够理解我们的意思。 

最近,微软的研究人员指出,当今的语音界面存在一个问题:它们自称为“智能”助手,可以讲俏皮的笑话,掌握大量知识,但是因为缺乏常识而让我们感到沮丧。 

研究人员还发现,有一些人会持续与数字助手对话,这些人往往开始时对数字助手抱有很低的预期。 

语音界面到底能够做什么? 

当你与语音界面讲话时,它必须具备如下能力: 

  • “听清”你的声音,将它与背景噪音区分。

  • 确定每一个词汇的起点和终点,将“哼”“阿哈”之类的词忽略。

  • 将每一个词的声音与字典中的词汇匹配,如果是同音异形异义词,语音助手必须根据环境挑选出正确的词汇。

  • 正确解释整个句子的意思。

  • 根据用户的请求生成有意义、实用的回应信息。 

Google从网络上收集了大量数据,如果你使用了Google服务,它还可以收集个人活动信息,所以在回答许多问题时Google Now可以提供中肯的答案。如果身处嘈杂的房间,当你向Echo提问,Echo听清问题的能力很强,主要是因为Echo安装了降噪远场麦克风阵列。除此之外,用Echo从亚马逊购物也很方便。 

在过去几年里,语音界面进步很快,理解日常、自然语音的能力大大提升,不再局限于呆板、谨慎的言辞命令。它可以处理一些简单的问题,比如:“有哪些人会参加澳大利亚网球公开赛?”还可以处理一些复杂的命令:“第一次参加澳大利亚网球公开赛的选手都有谁?”你还可以继续提问,比如:“决赛时会不会下雨?” 

除了英语还有许多其它的语言,因此情况更加复杂,Siri已经支持40种语言和方言,Alexa只支持英语和德语。还好,所有功能都在稳步改进。 

语音界面存在的难点 

语音界面会不会接管一切技术,正如电影《她》(Her)描述的一样?科技咨询公司Gartner认为,到了明年30%的技术交互将会通过语音会话进行。 

尽管如此,语音界面仍然存在局限性,光是改进技术还不能解决问题。噪音污染是一个主要的障碍。设备能够将用户的语音与背景噪音区分开来吗?技术的确能起到作用,它可以削减噪音、识别个性化语音、阅读唇语。 

你与智能设备说话,这些话对其它人来说也是噪音,这种背景噪音如何处理?我们不妨设想一下,在办公室或者飞机上,有人坐在你的傍边,他在与Siri对话,而你正在读东西,此时你就会明白:从社交层面考虑,语音并非总是能被人们所接受。 

还有一些问题来自于语音界面对精神的要求。学习使用语音系统可能是一件很困难的事,如果没有屏幕会更难,正如亚马逊Echo一样。 

如果打电话给银行、电话公司,你会听到合成声音,它将选项全都念出来,此时你要集中精力听,心中很厌倦,你一直等待,直到自己想要的选项出现,生怕错过了,这种悲惨经历相信每个人都有过。传统图形界面不存在类似的问题,它可以将选项展示出来,让你快速选择。 

当你学会操作语音命令,使用时也可能会分心。研究人员发现,与鼠标、键盘相比,语音命令更容易让人分心。 

如果在汽车内使用语音命令,危害更大,美国犹他大学在报告中指出,使用语音命令之后司机注意力分散的时间最长可达27秒。 

派上用场 

正因如此,语音界面暂时不会完全接管世界,不过它会在我们的生活中找到小市场,发挥自己的作用。在汽车中语音命令已经很流行,随着技术的改进,希望语音命令引发的分心问题可以得到缓解。 

在厨房内,你正在忙着做菜,此时你可以与Alexa交流,让它说出菜谱,更新购物信息。在VR与AR中,当你看不到自己的手时可以用语音界面控制系统。 

学习语言时,我们可以用语音助手练习发音。有些人运动能力受损,出现肢体重复性劳损,或者存在诵读困难,此时语音可以帮上大忙。语音界面是一种期待以久的技术,有许多理由让我们相信语音时代已经来临。不过语音命令还不是那么聪明,在语音购物服务中,你最好还是设置一个密码,免得孩子乱买东西。


Tags: 语音助手

发布: mjtmjtjj 分类: 科技创新 评论: 0 浏览: 44
留言列表
发表留言
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。