合作
咨询
返回
顶部

景鲲:语音交互重要的是用户体验 不是谁都能叫OS

来源:新浪科技 2017-11-17 20:02:00 浏览:78

在2017年7月5日的百度AI开发者大会上,百度发布了DuerOS开放平台即DuerOS1.0,在接下来的四个多月时间里,DuerOS加速迭代。在近日的百度大会上,百度推出DuerOS2.0,是基于DuerOS1.0的全面升级,包括升级的小度智能设备开放平台和全新发布的小度技能开放平台。

为了让用户享受到丰富多彩的技能,DuerOS不仅大幅提升了原生技能的丰富度与用户体验,还发布了小度技能开放平台。小度技能开放平台将面向内容类、智能家居类、生活服务类合作伙伴,开放百度的自然语言理解、知识图谱及系统意图等核心AI能力,提供技能开发工具链,实现“零门槛”开发。目前DuerOS的技能生态已拥有超过200个技能。

基于DuerOS打造的渡鸦,正是基于DuerOS最新2.0版本打造的软硬件一体化代表作。其内核搭载全新的DuerOS 2.0,在语音对话交互听清、听懂和满足三个方面都有更好的表现。raven H可为用户提供关于体育、歌曲和生活等丰富内容及信息。在智能家居控制上,raven H可与所有接入了 DuerOS 的智能设备联动。

会后,百度度秘事业部总经理景鲲接受了新浪科技专访,回答了与DuerOS2.0有关的问题。以下由新浪科技整理提炼。

百度度秘事业部总经理景鲲

(百度度秘事业部总经理景鲲)

新浪科技:新的交互方式如何走进真正家庭?

景鲲:OS是放在时代前沿的位置,我们推着它往前走。这样的变革往往需要更多的资源和资本力量。另外,我觉得整体的体验是很重要的。整个语音交互的体验,不止是语音交互的唤醒,是对整个产品的颜值、声音,整个一套端到端的体验。这些都是推动人们接受语音交互这种产品体验往前走比较重要的因素。

新浪科技:我们在视频中看到Robin用语音控制手机百度切换、收听新闻,无需唤醒词,那唤醒词消失了,会不会有隐私泄露的问题?

景鲲:大家在视频看到的Robin无需免关键词就可以用手机百度听新闻,是在限定的场景、限定的设备上实现的,而且与耳机配合使用,不会泄露隐私。在其他场景,你不唤醒它,这个设备跟云端没有任何交互。

新浪科技:百度在开发者大会的时候收购了一个做唤醒词的团队,他们在这4个月当中是承担着一个什么样的角色?为什么我们收购了这样一个做唤醒词的团队,现在又推出无唤醒词的技术?

景鲲:它(无唤醒词)只是在手机百度App这个环境里面,朗读模式免唤醒词。不是在家庭环境中的那种智能设备的唤醒词,那是做不到的,而且也存在一些隐私问题。所以只是限定场景,限定在App里面的人机交互。在家居的智能交互里面,唤醒词是必不可少的,因为有一定隐私的保护性,先唤醒它之后再跟它说话,没唤醒之前,他不跟人做任何的交互。

我们收购的公司叫KITT.AI,是做智能家居领域智能交互的唤醒词的。很多合作伙伴都想做自己的唤醒词,包括DuerOS赋能的音箱、冰箱、电视,他们都需要在设备上为唤醒做优化。他们往往需要针对设备优化,因为麦克风的距离不一样,麦克风的个数不一样,所以需要对于这些设备进行特别的调优才能真正保证好的用户体验。通过KITT.AI,我们已经把这种技术推给我们的合作伙伴,搭载在他们的麦克风里面,使得效果更好。

新浪科技:个人开发者肯定要用到用户的一些隐私。作为百度来说,怎么能保证这个安全性?

景鲲:首先我说一下为什么我们要发展个人开发者。我们真正要推动一个产业,需要从产业头部厂商、中小厂商和个人开发者共同推动。尤其我们看到一个信号:个人开发者虽然不具备很多渠道,但是他的创意是无限的,他们会把这个能力放在不同的设备上。

前一段时间有一个开发者把语音对话的模块放到了燕舞的收音机上,让那个设备重新焕发了青春。燕舞公司直接找到百度,原来燕舞的群体是今天消费能力最强的群体,DuerOS让他们的公司有了更多的活力。

所以个人开发者对于我们的生态来讲能贡献很多想象力,是一个源泉,很有意义。说到隐私,我觉得倒不太存在,因为个人开发者开发的个人设备往往都是自己使用的,他没有很强的渠道推广能力,不能推广到很多人。

新浪科技:这4个月当中有没有什么新的合作伙伴跟我们分享一下?屏幕上放了一些小米、美的等等,除了这些比较大的企业之外,如果有一些小的创业公司或者是个人开发者找过来,我们会采取怎样的合作方式?

景鲲:首先我们有很多个人开发者,我们大概做了三场围绕开发者的线下活动。火爆程度都超乎了我们的预期,基本上200人的场来400人。整个长尾的,个人开发者的热情是特别高的。

所以我们的开发套件,最开始做整个软硬结合。7月5日我们发布的时候碰到了一个挑战,就是库存不足,补了两个月才满足这个库存。一开始我们没有这么大的概念,但是这是一个信号,就是开发者的热情是特别高的。

关于我们新的合作伙伴,大概在这个月和下个月可能就会宣布两个新的、很重量级的合作伙伴,这个我先不说,大家期待一下。

今天下午因为你们先上来了,我们就有几个重量级的合作伙伴宣布了。比如今天下午我们宣布了跟飞利浦的合作。他们是国外最流行的智能家居灯泡设备。DuerOS是首家跟他们达成这方面战略合作的。今天下午我们跟招商银行信用卡也宣布了合作,我们的合作是第一家银行跟对话式人工智能接口的战略合作。

新浪科技:渡鸦背后的技术相比于其他的智能硬件的厂商来说,最核心或者说最具竞争力的技术是什么?

景鲲:渡鸦除了产品本身的特性之外,跟DuerOS相关的技术包括,比如说渡鸦的麦克风阵列,它用了8个麦克风,上面盖子4个,下面底座4个。像这种新的麦克风阵列技术,现在应该是业内首家尝试的。

渡鸦设备上面的盖子拿下来之后,它是可以按住说话的,也就是它是近场的。所以说这是一个远场和近场融合的交互方式,这也是跟它的设备特性相关的。

还有就是音乐的打磨,我们基本上把音乐升级之后,整个音乐标签做得更多了。做了7千多个应用标签,让用户在这种智能设备上,可以播任何一个标签的音乐。加上我们很多新的能力,刚才在下面说,我们有100多个第三方技能,这些技能都会先跟渡鸦设备做一个紧密的结合。

所以我觉得,渡鸦的整个产品特性是软硬一体化,全面的融合。从设计到声音,到我们的技术能力,到后面的内容,整个包装成一个用户体验很好的产品。

新浪科技:DuerOS落地最多的场景是哪些?您看好哪些产品?

景鲲:我只能从我们自己的角度出发。现在市面上大的手机的合作厂商,背后很多语音交互的能力都是我们提供的。潜移默化的,DuerOS已经在很多手机背后了。

在电视的场景,我们无论是跟传统的智能电视厂商、还是跟OTT有线盒子,还是广电系的盒子,基本上都有很好的合作。

音箱上也有很多,刚才说的有一家DOSS音箱,它本来是搭载Alexa系统出口到国外的。但是它现在搭载了DuerOS系统在国内销售,已经在亚马逊上开卖了。

车载我们是跟Apollo紧密合作在一起的,所以我们跟北汽、一汽都会合作搭载DuerOS系统的设备。

再其他的就更加分散了,像可穿戴、耳机,就稍微分散一些。几个大的品类就是刚才说的那些。

新浪科技:现在各个语音厂商也都有自己的平台,模式看来大同小异。其他家的这种系统也搭载在音箱里面能交互,为什么Duer就能叫OS?

景鲲:最开始是我提出来叫OS的。我对OS更多的看法是它是一个生态,一个操作系统。操作系统背后是一个生态,是一个平台,不仅仅就是音箱的一款产品。这取决于业务的发展思路,是做一款东西,还是想做成一个生态,把大家在这个平台上一起推动发展。

我觉得DuerOS代表了我们的愿景,OS就应该是一个生态。我稍微引申一下,一个OS最核心的关键点,不是它叫不叫OS,是它是不是有自己的生态。如果他没有自己的生态,它就不是OS。

移动时代有很多OS,但是后来你发现,它都没有自己的生态。Android有自己的生态,Windows有自己的生态,是OS,如果你是附着在这些平台上的就不能叫OS,因为你没有自己的平台。所以我们DuerOS也是希望在语音交互这种新的模式下,能够创建自己的生态。这个生态是基于新交互的生态,这是我们为什么命名成OS的原因,就是它是一个开放赋能的平台生态。

新浪科技:今天最开始在宣传片里面,大家说现在这个技术是基于Android或者是Linux的,是我看错了吗?

景鲲:你可以这样想,原来那些系统都是上一代的,是一个底层的系统,并不是那么关心交互的。DuerOS是以用户交互为驱动的操作系统。

移动时代跟原来的PC有很多不一样,AI技术跟原来的也不一样,AI的设备很多样。这种多样的情况下,DuerOS要做的就是通过语音交互,把用户和不同的设备统一在一起。这是DuerOS要绑定的关系。其他的OS我把它看成是我们原来的系统适配层,适配到原来传统的OS。但是DuerOS是一个语音交互的平台,更上层一些。

新浪科技:跟厂商合作的时候,您了解到他们会比较看重哪些指标?因为我发现有些厂商后来更换了百度的系统,不知道有没有什么具体的一些策略?要做一个设备的Android系统,现在已经到哪一步了,您觉得还差什么?

景鲲:设备厂商现在最关注听懂和满足。其实这一块是老百姓最关心的。

我觉得发展到现在,我们需要探索如何做一个最好的产品体验。现在大家都有点Follow美国Echo的路线,就是他们怎么做我们怎么做。我觉得我们要做世界级的DuerOS。人机交互在美国也是很初期的。

在中国的场景里面,中国的家庭环境比较小,美国是大房子,中国是小房子,什么样的交互是好的交互,多快的交互是好的交互?这些需要很多的探索。大家如果不关注用户体验,都不会看到这种细节,就会觉得现在Echo这个就是好。

比如响应速度,我们现在基本上是1.25秒到1.4秒。现在讲的极致的是650毫秒。如果再快,用户会觉得虽然你很智能,但有点抢话。

 

原来我们做搜索引擎的时候觉得越快越好,但是在这种新的人机交互上来讲,你会发现有很多原来的认知都会有变化。回答你刚才的问题,还是把用户体验做对。把每个设备在每个场景里面的用户体验做对,现在是最重要的。

准备好加入这场人工智能革命了吗?立即加入