陈立彤:下面请科大讯飞智能汽车事业部语音产品线产品总监邢猛给大家分享人机交互语音识别技术对汽车智能化的影响与推动。

    

科大讯飞智能汽车事业部语音产品线产品总监邢猛

    邢猛:我是来自科大讯飞汽车事业部的邢猛。首先说一下科大讯飞,上午也说了,科大讯飞和BAT正在把人工智能技术提升到各行各业,智能汽车事业部做的是把人工智能技术在车上做的更好,打磨的效果更优,然后更好的去帮助汽车行业服务。其实我们汽车事业部做的不仅仅有语音,汽车里提到的服务、UBR保险服务等等我们也在做,这种产品本质上也是基于人工智能技术。第二,讯飞不仅仅做语音,也做出了视觉,为什么做这种差品呢?因为语音和视觉更好的结合在一起这样才能给用户打造一种完整的闭环消费体验。

    下面开始今天的分享,叫汽车智能人机交互下一站。

    目前逐渐形成一种共识,现在的人机交互是以机器为中心向以人为中心自然交互,随着触摸屏发展以后用点、触、控,这发展以后对人的体验有很大的我们在思考未来人工智能产品将会是什么样的?现在讲万物互联,不能每个设备都配上鼠标和触摸屏,我们就觉得语音是很好的方式,会以人为中心更好的交流。同时语音有一个好处,对万物互联有一个标准,只需要一个麦克风、摄像头一切就可以了。

    第二个看一下人工智能技术发展,总结了三个阶段:计算智能;感知智能,是现在所处的阶段,叫能听会说、能看会认,能听就是语音识别,能看就是图像识别,有一些据因识别不能深入的理解你,就是人们对知识的表述做的不是很好;第三个阶段认知智能,那么机器对人工智能帮助会极大的提升。

    刚才提到语音识别、人脸识别、输入法做的很好,某些领域可以使用了,但还是要直面现状,其实人工智能技术的发展还处于弱人工智能。其实我们做语音识别,语音识别做的很好,新闻稿可以念出来,今天组织的展会文字可以出来,但现在有一点,医疗领域专家做演讲的话会发现语音识别率马上会降低,有可能达到80%,有可能达到50%。这个情况就是我们想说的用户群体,现在语音识别对知识理解不了是识别不出来的,所以我们要做这个的时候要分析用户群体。比如说车展,要把用户关心的业务,把这种识别会做的更优。语音识别里考虑第二个语言风格,我们说普通话语音识别识别的很好,但是方言就不行了,这种在车展上怎么做?因为每个车最终的用户定位不同、销往也不同,我们就看这个车销往哪个区域,用户口音是什么,针对这个口音会做更深入的数据迭代,这叫做语言风格。第三个使用环境,其实我们在用语音识别的时候,如果在家里面、办公室或者很安静的环境下,语音识别效果非常好,如果在今天的会场大家会发现周围很大的嘈杂声,会发现语音识别用不了,所以语音识别一定要注意使用环境。在高速噪声非常大的时候,如何保证语音识别的利用这是我们思考的问题。

    第二个语言理解,我说的语言理解基本上时候很初级的自然语言理解,它无法推理,只能把人工经验复制给它,所以我们做语言理解的时候要考虑语言特性,它的结构非常复杂,说语法结构、主谓宾、介词、代词,一定要把这些东西理解出来;第二个表达多样,同样一个意思,用户表达的意思可以多样;第三个语言歧义,用户表达的时候可能说的不清楚,不清楚的状况下怎么更好的理解。我们通过对话情景等等解决这些问题。

    第三个语言沟通要讲反复自然,因为我们在和机器交流中会发现不舍得用,你会发现没有感知的东西在里面,所以我们想把更人性化的东西加入里面,比如说我想去长城,他会知道一分钟之前问今天感冒怎么办?他会告诉我今天感冒不适合出行,他会给你做提醒。同时你今天心情不好了,他会哄你,不是冷冰冰的机械交流。怎么反复自然,我们在语音合成上也做深入的思考和打磨。

    人机交互的痛点刚才说了怎么交互准确、对话智能、机器感。

    2010年我们命令式交互、2017年自由式交互,现在做基于场景的对话交互。

    现在有AIUI的新特性,我们会降噪会把这个做的更准确一点。

    第二个是双工交互,我们怎么把冗余的信息让机器去除掉,保证交互、沟通更流畅自然。恩第三个多轮对话,多轮对话目的是什么?是因为这句话他不理解,所以一定要再询问我一次,这是做多轮对华的目的。

    刚才讲到了个性和扩展,这也是刚才说的为什么要做个性化,我们看到刚才说识别、递解、合成,我们会把这个链路打的更深更细。

    最后看一下人机交互设计的核心,人工智能技术一定要和业务结合,交互一定要做的深入,当你问机器的时候不能总是反馈听不懂,一定要以另一种方式引导他做完,包括对话管理有很多信息,要把对话管理充分利用起来。内容管理有很多主机厂反复说,语音识别用户也用的不频繁,语音识别是一种手段,用户是想获取内容服务的,所以我们要把更好的内容服务做起来。

    最后是对基本人工智能的要求和了解,怎么找到更好的场景做结合。同时最后尊重行业、尊重业务、尊重用户,我们不是为了做人工智能而做人工智能,而是真正解决用户的问题,解决生活和工作场景的效率,然后做出好的产品,谢谢大家!