7月5日上午,2017百度开发者大会在北京国家会议中心举行。在上午演讲环节中,百度度秘事业部总经理景鲲宣布百度DuerOS开放平台发布,并介绍了AI领域关于语音交互方面的一些核心技术问题。
景鲲表示“唤醒万物”是DuerOS开放平台的核心理念,实现设备和人使用自然语言沟通。相较于鼠标和键盘式的复杂交互方式,语音交互具有更广阔的适用场景;同时得益于ios和Android生态系统的建立,让软硬件生态系统模式得到认可。
DuerOS自今年1月份推出后,已先后与中信国安广视、小鱼在家、哈曼、美的、海尔、联想等企业达成合作。景鲲认为,唤醒万物的核心三要素是要做好听清、听懂、满足。听懂是人工智能时代用数据和技术解决的关键问题。“只有百度在中国市场是唯一具备听清、听懂、满足的实力”,Duros旨在打造一个开放赋能的生态系统。
以下为景鲲的演讲实录:
什么是“唤醒万物”?我们天早上出门的时候,都要帮妈妈调整好电视,并嘱咐说不要按错按钮。和电视的交互为什么这么复杂?我们为什么不能过着“动口不动手”的生活。
DuerOS就是让设备和人用自然语言沟通,懂得人的需求。每一次人机交互的更迭,都在改变人们的生活。电脑、智能手机等都是如此。现在智能语音对话,将成为更智能的交互方式,这个影响将比移动时代大得多,因为适用范围更广。
国外市场已经进入到白热化竞争,亚马逊、谷歌、苹果、微软都投入在语音交互领域。国内有4.5亿家庭,有3亿辆车。
DuerOS是人工智能时代的Android,是开放赋能的生态系统,也是最具活力的生态系统,涉及多个领域的软硬件厂商。
唤醒万物的三要素:听清、听懂、满足。
很多友商在做类似的事情,有些能做好听清,但做不好听懂,而百度是唯一能做好三要素的公司。
听清方面,百度有很多技术储备。另外人工智能时代,技术还要跟场景结合,真正去解决问题。我们也研发了远场语音技术。
听懂是AI时代用技术解决的核心问题。数据多、技术深是必要条件。百度在数据上有巨大的优势,只有具备很多的知识,才能听懂用户的需求。
我们的NLP技术一直是行业领先者,我们的多轮对话技术应用在场景个性化等领域,率先引入多模索引。
AI时代,人们和设备沟通的时候,会有更自然的表达。只有把自然语言需求都满足,才能听懂,而且要做好在某一场中的多轮对话需求。
听懂目标的Freestyle,希望用户表达的时候,说你所想。
我们还希望汇集全球的技术。
百度宣布全资收购了语音交互技术创业公司KITT.AI,并把相关技术免费开放。KITT.AI此前也接受了亚马逊的投资。
百度希望汇聚全世界最顶尖的技术,并向外界开放赋能。
此外,百度还能提供十大类、100多个小类的能力、第三方服务提供给DuerOS开发者。只要设备接入DuerOS,包括音乐在内的所有的资源都免费开放。
AI时代软硬结合还要很多障碍,开发门槛还很高。为此,DuerOS还将提供软硬件一体化解决方案,包括多样化的开发套件和完全开放的参考设计。相关资源都在DuerOS官网可以下载查看。
今年四月,我们收到一封深圳嵌入式工程师的来信。他想用DuerOS把乐高玩具改造成对话式的产品。
DuerOS希望赋能每一个有梦想的人。