合作
咨询
返回
顶部

DuerOS现身中国机器人行业发展论坛 为行业赋能

来源:TechWeb 2017-03-25 10:19:00 浏览:78

3月18日,2017中国机器人行业发展论坛暨第三届恰佩克颁奖典礼在苏州圆满落幕。在百度战略合作部牵头下,度秘事业部总经理景鲲出席了本论坛,并在下午举行的以“服务机器人与人工智能+”为主题的分论坛上发表主题演讲。

现场,景鲲向与会嘉宾们分享了百度在人工智能领域的投入和想法,并围绕人工智能领域的前沿科技热点展开热烈讨论,共同展望未来。景鲲在现场表示,每一代的操作系统使用的交互方式都是越来越向人最自然的交互方式转变。在经过第一代以鼠标键盘和第二代用手指跟移动设备交互后,百度希望通过第三代对话式人工智能操作系统,让更多的用户受益,让更多的用户能跟设备进行交流,获得信息和服务。

\

(百度度秘事业部总经理景鲲现场发表主题演讲)

人工智能技术的创新蓬勃发展让机器变得更加“智慧”。景鲲同时坦言,当下人工智能火热,但让用户通过语音方式跟设备进行交流,让人工智能走入寻常百姓家仍任重道远。百度愿意作为一种最基础的能力开放给合作伙伴,强强联合真正解决不同用户场景的需求,把人工智能做大做好。

以下为演讲全文:

大家好,很高兴来到苏州,这不是第一次,但是感觉这一次特别亲切。今天希望跟大家分享一下百度在人工智能方面一些想法和投入,其实听钱总讲了很多人工智能的东西,特别有启发。但是后来我发现,无论是从研究还是物联网、产业,其实大家的想法是趋同的,未来人工智能会有很多发展,所以今天我在想的是——百度在人工智能方面的投入,我们下面去做什么,我们将来想做什么以及我们现在是怎么做的,我们如何跟大家一起来合作共赢。

在讲之前我先放几个电影小片段。这个电影叫《Her》,很多人应该都看过,它是一种虚拟的人工智能,但是用户可以通过耳机和手机跟它来交互;下面我们再看另外一段影片《钢铁侠》的一个片段,贾维斯是另外一种形态的人工智能,像这种类型的人工智能基本出现在每一个科幻片里面,我们会想:如果我们所有看过的科幻片都会有一个这样的人工智能存在,它或者是实体的,它或者是虚拟的,但它肯定是无处不在的,它肯定是非常个性化的,这样的影片不只被我们在这屋子这个行业的人喜欢,它被很多老百姓都喜欢,老百姓喜欢它的原因是它想出了我们希望未来是什么样的未来。

所以从人性的角度,我们其实希望未来有这样的助理服务,帮助我们能提供一些个性化的服务,这是未来,我们是不是能现在达到这样的未来?人工智能现在的技术是不是能达到这样的未来?现在肯定还有很长的路要走,所以我今天分享的路径就是:如果我们的愿景是在这儿,我们脚应该踩到实地上,我们怎么样能有一条路从现在走到这里面,所以我想分享的是百度在这个路径上是怎么想的。

百度度秘想做的事是第三代的操作系统,第一代的操作系统是用鼠标和键盘跟用户交互的,第二类的操作系统是移动时代的操作系统,是用手指在跟移动设备交互的。每一代的操作系统,它使用的交互方式都在越来越向人最自然的交互方式来转变,而每一代这样的转变都在让更多的用户受益,让更多的用户能跟设备进行交流,能去获得信息和服务。那最自然的交互当然就是对话式的,所以我们现在做的就是第三代人工智能操作系统。曾经我们原来跟设备是这样交互的——在这屋子里面很多人原来要学输入法,要学五笔,原来我们都在学习机器的语言,基本上那个时候我们学键盘学五笔的时候跟机器的沟通是很费劲的,我们现在想做的,在人工智能时代,随着数据、计算力、人才的集聚,我们希望让机器能学会人的语言。

我们来看一下,平时我们是不是更习惯用我们的语言?这个是整个百度语音的调用情况,我们看到手机百度语音日活用户在过去一年增长100%,而且这种趋势是几年不变的。这是我们最近在手机百度这款日活过亿的APP上,增加的一个按钮叫“按住说话”,从它的使用量、从用户的表扬上来讲,使用率急剧的增加表示人们是更加习惯跟设备用人类自己的语言来进行交流的。

那说一下我们百度的优势在哪。第一个,最近大家可能从新闻上读到百度成立度秘事业部,并直接向陆奇汇报工作。其实,有时候尤其是做企业的时候,你会发现在创新时最难改变的是组织的创新,当你解决组织的问题之后,很多创新的问题会迎刃而解。当然,陆奇来了之后,非常高兴公司决定升级度秘事业部,作为百度七大事业部之一直接向陆琪汇报工作,当然其他事业部有搜索、金融等就不赘述了。我们再来看今年的两会,李彦宏的三个提案全部聚焦在人工智能领域,他非常希望将来无论是桌子椅子将来都是可以变成人工智能的,都能装这样的一个操作系统,用户可以跟桌子椅子直接去对话。

百度在人才上的投入也很大,除了组织方面,我们百度汇聚了全球在人工智能全球最顶尖的人才。我们在硅谷有一个几百人的office做世界最领先的研究,我们在北京、上海、深圳都会取得人工智能领域最顶尖的人才。在技术方面,我们应该是在世界领域内都走到最前沿的一个公司,现在涉及到人工智能的领域,我们基本上都是研发了五年以上,语音板块中,2014年MITVB全世界突破性技术的第二名是百度语音,我们在百度语音上做了很多工作,包括我们非常自信地把百度语音放到手机最下面的一栏。当然只有语音还不够,我们在自然语言方面的投入也很多,我们把自然语言模型用到了我们搜索、广告以及人工智能对话系统上;在图像方面,很多人脸方面的应用正在落地,像是百度大厦安装了人工智能刷脸机,每天几万个员工通过刷脸进入百度大厦。

其实这些技术是不够的,因为用户要的不是技术,用户要的是端到端的能力、端到端的内容。百度在信息和服务生态方面做了非常多的储备,百度搜索本身就是一个大生态,我们所有跟搜索相关的信息和服务生态都可以跟对话式的交互进行沟通。我们会把整个百度的能力打通,还会引入很多第三方的合作伙伴在我们的操作系统上去开发内容。所以将来在交互系统上汇集的能力不只是百度的能力,还有很多来自其他合作伙伴开发的能力。

我们现在看到度秘目前提供的内容是非常多的,基本上每天都在增加。所以今天度秘的功能可能已经不止是70个了,可能是170个。举几个例子,刚才说知识的运用很重要,搜索引擎是最大的知识库,利用搜索引擎的知识库,我们每天看到有很多用户的交互。我们为什么要做语音搜索呢?是因为语音搜索能让我们看到的数据跟原来传统的关键字搜索不一样,关键字搜索的时候,用户打北京空格天气,这是机器的语言,就是搜索引擎的语言,这不是人的语言。人的语言是说明天苏州下雨吗?后天苏州冷不冷?所以在我们加上语音交互之后,很多用户用更口语化的方式在跟百度搜索进行交流,每天我们看到非常多这种口语化的表达,而这些口语化的表达就是用户每天在正常生活中的表达,我们看到的这些数据、知识,是从整个百度搜索大知识库上挑取的知识。

除了刚才的一些百科知识,当然搜索上的我们原来叫阿拉丁系统结构化的知识非常多,涉及到生活领域的方方面面。比如说我们最近跟海尔和美的合作在做智能冰箱,他们特别需要的一个知识是菜谱知识,对于他们来说抽取菜谱、维护菜谱的更新很难的,但是对搜索引擎来讲易如反掌,我们也很愿意把这些能力免费的开放给我们的合作伙伴。所以从整个百度信息方面的能力来讲,数以万计的能力都会作为通用的支持开放给我们合作伙伴来使用。

我们可以很自豪的说,我们对点评数据的理解可能比点评还懂点评,我们为什么能懂这些数据呢?因为传统方式是用人工去打标签,最多打一百个标签可能就够了,我们是怎么打标签的呢?因为我们是搜索引擎,所以我们能抓到用户的评论,用户评论里面评论了什么?这些评论都是标签。原来的话用户说我想找一个可以带狗去的餐厅,在点评里面是找不到的,但是在真实情况下用户是有这种需求的,因为用户的评论中会评论这家好像可以让我带狗去,所以我们把它的标签从一百个增加到了10万个甚至到了千万个。这个例子也展示了我们多轮对话的一个能力。

原来我们讲通用人工智能开放到门非常难做,但是我们把这种能力限制在一个具体场景里面的时候,复杂度急剧降低。如果我们看到这个提醒——上海降温五度,这个是用户的一个真实需求,我们还有用户真实需求是雾霾的时候提醒我出门戴口罩,人是很难每天去看时间、温度、雾霾的,但如果机器能有这种提醒能力,在某一个垂类里面是可以做的很好的,所以我们把这种通用智能能力的愿景,把它变小变成场景化,跟一些具体垂类和场景相结合,会解决用户很多实际的问题。

所以今年拉斯维加斯我们正式对外宣布的第三代的对话式人工智能操作系统,我们希望它是无处不在的,它是可以被很多合作伙伴服务的,而且是免费服务的。我们今年已经宣布了跟很多家企业合作,从小鱼在家(一个智能机器人)到海尔、联想、小米等等,我们的合作伙伴来自各行各业,只要他们希望用对话式的能力我们都会免费的,跟大家一起去开发这个市场,所以也获得了一些行业大奖。

这个例子比较有意思,是我们做的一个TV,可以给大家看一下。原来我们跟电视进行交互是非常困难的,搜索体验基本是非人的体验,但是刚才看到有了语言能力之后,用户跟电视就可以非常简单的进行交互,而且刚才最后一个例子我不知道大家是没有注意到,我们可以直接跟电视问这个人是谁?原来的做法是基本上是对电视进行标注关键词,但是用户往往在任何情况下都可能会问,我们的做法非常简单粗暴,我们把一个电视前几帧全部截下来发到云端,通过图像识别能力把用户跟图像内容互动起来,想象一下,我们看到电视里面的明星不认识时,我们会问明星是谁,或者我们看到这个车不知道是什么品牌时,我们们看到这个人穿的衣服很漂亮想找同款时,用户可以用这种语音加图像的方式跟电视互动起来了。

这个例子是我们大概在今年拉斯维加斯做的一个机器人的例子。参与演示的是吴恩达,他基本上不太会说中文,可以看到我们的语音识别连“蹩脚”的中文也能识别。然后刚才这个例子比如小鱼在家,我们可以把它假想成在美国,加上一个屏幕加上一个摄像头之后用户的交互能力就会变得很不一样。

刚才他讲述的例子是锤头鲨的图片,其实这是在我生活中真正发生的,我平时跟我儿子在一起玩的时间特别少,所以我陪他玩的时候他特别烦我玩手机。有一次,我给他讲鲨鱼的故事,讲到锤头鲨的时候他说爸爸什么是锤头鲨,其实真的很难用语言去描述锤头鲨的样子,因为你说脑袋就是那样的是很难描述的,我说我给你找一下。当我把我手机掏出来,他说爸爸你不是跟我说不能玩手机吗?你怎么还自己玩手机?这时候旁边如果有个锤头鲨的图片能够出来,我的三岁的儿子就能瞬间明白了什么是锤头鲨。所以有了这样的设备之后,在家庭场景里面就会有很多想象力。在百度的平台上我们不只开放单项能力,我们希望把我们的语音对话人脸和我们大数据全部开放给我们的合作伙伴,跟伙伴合作伙伴携手把这个体验来做好。

其实最后想说一句,人工智能现在非常热,但是人工智能的落地,走入寻常百姓家还是非常大的挑战,怎么能够让用户形成认知,让用户用语音的方式跟设备进行交流,这个巨大的市场需要我们整个行业的人一起去努力。今天在下面听完很多嘉宾对整个人工智能行业的做法和畅想后,我们也希望跟所有的用户、客户一起联手,大家一起把人工智能做大做好。百度非常愿意作为一种最基础的能力,免费的跟合作伙伴走到一起,强强联合把真正用户的场景做好,把用户的需求解决好,所以这就是我们百度想做的。

谢谢大家。

准备好加入这场人工智能革命了吗?立即加入