合作
咨询
返回
顶部

GMIC大会开幕 百度揭东辉:DuerOS正推动创新产品爆发

来源:CSDN 2018-04-26 13:50:00 浏览:78

 “产品体验是推动人机交互变革的核心突破口。”4月26日,在GMIC全球移动互联网大会“全球创新硬件产品秀”分论坛上,百度度秘事业部智能生态副总经理揭东辉在演讲时表示,在AI时代,逐渐成熟的智能语音交互技术让人机交互方式变得更加智能,将智能设备的用户渗透推向新高,也让用户使用智能设备的门槛越来越低。

\

 

(百度度秘事业部智能生态副总经理揭东辉)

除了AI语音技术,产品体验是一个核心要素。揭东辉说,产品体验是让DuerOS真正落到实处,渗透到生活中的根本原因。产品体验是分场景的,包括手机、电视、车载等等场景的渗入和设备的搭载,都是DuerOS能够走进用户生活的原因。自2017年7月正式发布以来,DuerOS的合作伙伴数量已经超过了160家、搭载DuerOS落地的主控设备也超过了80余款,DuerOS落地硬件解决方案超过20个。

百度3月重磅推出的国内首款智能视频音箱小度在家是揭东辉带到GMIC的创新AI硬件。他表示,AI时代,光做上层的OS、应用层远远不够,更需要软硬件结合,让AI能力在产品上体现出来。小度在家就是一款集智能音箱、智能电视和可视电话于一身的创新性产品,它突破了以往用户与设备的交互体验,承载着“让全家人享受到科技乐趣”的使命。

以下是揭东辉演讲实录:

揭东辉:今天分享的主题叫做“为AI发声,智领未来”。

如果我们把时间轴往前挪一挪,AI在电脑发明的时候,那时候大家就往这方面探索,那时候整个交互系统还是很不好用,最早是键盘,后面发明了鼠标。这种情况下大家对科技还有很高的热情,到了移动交互时代,大家认为手机是解决日常生活的工具。会把手机握到手上,除了它的功能很强大,另外一个层次是原因它还是很好用,手指点就可以了,点到的东西就是你要的东西。

到最近AI这个时代,我们现在开始语音交互的技术越来越成熟,这种情况下交互方式变成越来越智能,使用门槛越来越低,所以它的用户渗透会越来越高。这种情况下我们做了我们的DuerOS。这个系统出来以后,我们不再需要找遥控器,不再需要找APP打开看看调用的功能,人用语音跟它交互。这种情况下DuerOS就可以渗透到任何场景里,比如早上起床,我们可以用智能音箱闹钟唤醒,洗漱的时候可以有一个屏给你推送信息,车上有可以跟你自然交互的,上班的时候智能语音助手,一系列的产品辅助办公工作,最重要回到家里,可以原厂交互的电视。小朋友可以用智能语音玩具跟它做很好的交互。

另外一个很核心的东西是你要有很好的产品体验,产品体验才是让它真正落到实处,渗透到生活中的最根本的原因。大家刚开始用一个产品的时候,一定是说满足你的功能,是工具性的产品。逐渐到后面你可能会说这个东西挺顺手,喜欢用它。一直到好的产品体验是离不开它,少了它某些功能就缺失了。产品体验是可以渗透到生活中的基本原因。

产品体验的核心,我们认为它是分场景的东西,举个例子,像是手机,大家都不觉得手机需要唤醒功能或者需要强的语音交互功能。但是当我们把手机这个场景放到开车的导航的时候,手被方向盘占用的时候,就想说导航的手机如果能够语音操控是多么好的事情。在这个想法下,会把DuerOS跟场景结合,落实到各种产品里去。

智能电视做的应用场景是除了能够看很多片源以外,可能还会说这个场景里面主演是谁,配角叫什么名字,演过什么电影,或者想说获取一些配乐是什么来历,是什么曲子。这个东西智能交互的电视提供的好玩的功能。

有了这么多功能以后,有很多伙伴问这些功能是不是能为我的产品所用,这个答案是“YES”的,我们所有的能力都会开放出来。我们提供最底层的东西,解决语音交互中的听清、听懂、满足的基本功能。听清是通过语音声学技术让人的声音能够很清晰被机器识别。听懂可以让一个很长的句子,或者不是很清晰的意图,能够被自然语言处理识别出来,明白你所要的需求,到最后的时候一定是它能够满足你想要的需求,比如你听歌,要点外卖,或者获取信息,或者只是简单问天气。我们构建了100个品类,通过这些满足用户的需求。

我刚才说的这些能力分成原生能力,包括百科等等的。第三方能够提供的能力也可以进来。

我们有一个核心层,包含了现在说的语音识别TTS,知识图谱、自然语言处理。最上面应用层可以跟厂商合作一起完善的,包括整体的参考设计、硬件的麦克风芯片的选型,工业设计的能力,一直到手机上的交互APP的定制。

DuerOS平台是去年7月5日发布的,这个发布以来到目前为止超过160+合作伙伴,这些合作伙伴分布在各种渠道跟行业,包括电视、家电、玩具、音箱等等的产品,以及智能家居,各个行业都有落地。我们提供了一些方案,包含了从最小的芯片级的,大约是只能跑小系统,一直到安卓等等,全系列硬件结合的模组。搭载DuerOS能力的产品超过80多种。

我们一直在迭代,今年7月份还会有开发者大会,我们还会有更有趣的东西发布,也欢迎大家7月份一起来参加我们的开发者大会的活动。

我们认为AI时代,光做上层的OS、应用层远远不够,它需要软硬件结合,就是一定要让AI跑在产品上才能体现出能力来。突破性的创新产品一定是很好玩的硬件呈现的。

小度在家就是有创新性的硬件交互,首先智能音箱可以听音乐、聊天,同时代有智能电视的属性,可以看电视的时候了解所有的,你可以说当前电视里面有些什么人,这些人有什么人物关系,可以帮你介绍这些东西。甚至你看某个明星,只看某个明星片段,它可以筛选出来。还有智能手机的属性,包含移动通讯,或者视频通讯的能力。这些结合在一起做了小度在家的产品,这个产品我一直想说怎么描述它,发觉语音描述很难,我可能要说123467有各种的点,好在今天的交互也是带屏的交互,不是语音的。所以来看大屏幕它有什么好玩的能力。

我们不会给你介绍这个软硬件改了多少版,多少人花了多少心血做,今天要分享一下它的一些设计原则,因为我们讲是创新产品。

首先一个特点是多模态的交互,当语音很难描述一个东西的时候,你用视频,多模的方式可以有宽广的呈现方式。尤其我们这种无屏音箱,在一些应用上本身就有局限性,本身以听为主,听是单线程,必须专注才能抓到内容。比如问它天气的状况,它回答给你可能是很标准的模板,比如天气晴,最高最低是多少,空气质量多少,对用户可能就是一两个点,是不是下雨了要带伞,要不要加衣服,这样有带屏的呈现就很简单,秀在平米上,用户扫一眼就看到了。

多模态的交互另外场景上有很好应用,比如购物场景,语音购物是很不流畅的购物体验,你没有商品选择的权利,也看不到商品长什么样。 还有跟地图相关的服务,也只有在带屏产品上才能呈现出来。

我们会做智能交互的引导,这是很重要的一个事情,在我们一些数据上来看我们发觉很多无屏产品会看到唤醒以后会有很大比例是突然不知道要问产品什么样,有些产品唤醒之后是空语音的状态能达到30%的比例。我们可能会有很好的内容,有很好藏在后面的东西,但是用户不知道怎么获取,这时候作为一个有屏的引导就很容易做引导交互。

还有一个产品本身是有多属性的,尤其像在家庭的产品,一定不会只为一个人服务,它应该要有多用户的设计理念,比如小孩什么样的呈现方式,老人用是什么样的交互方式。

一二线城市,尤其现代年轻人的家庭结构里,有4种人物画像:缺失的爸爸、焦虑的妈妈、失控的小孩、孤独的老人。我们希望通过小度在家能够帮我们来解决这种人生活中改善一点点,每天改善一点点,希望能够给大家更好的体验。

DuerOS是一个开放的系统,我们希望这套系统提供最基本的软硬件的能力,大家一起来做上面的差异化,它上面的产品化,然后把创新的产品真正能做到推动万物爆发,大家都能做出新的好玩的东西。

谢谢大家!

 
准备好加入这场人工智能革命了吗?立即加入