出国留学网 > 留学论坛 > 科学 >

百度2016世界大会震撼发布“百度大脑”

目录

__叶落__

回复 1 楼 2016-09-02

百度2016世界大会震撼发布“百度大脑”

百度大脑

  百度2016年世界大会于昨日举行,本次百度世界大会以“人工智能”为主题,百度公司创始人、董事长兼CEO李彦宏围绕人工智能发表了主题演讲,李彦宏认为互联网即将开启以人工智能为核心的下一幕,而且强调:人工智能将是百度核心中的核心。

  百度大脑计划,让我们来一次详细的百度大脑解剖:

  第一层:开放云

  作为一个人类婴儿,其第一件最重中之重的事情就是记忆,而记忆也是一切的发展前提。同样,我们将百度人脑看成人脑的话,那么第一件事情,必然是存储。人类没有记忆就没有关联,也更不用提决策与创造,而人类之所以能够在灵长类动物中立足,正是有着极大的可以存储记忆的脑容量,那么机器要模仿人脑也必然要建立在拥有庞大的存储能力之上才有可能,而百度也是在真正积累数据到一定程度后才开始该项目。

  我们来看下百度存储能力的发展过程:

  四年前也就是2010年,百度的机器学习能力并不是很高,只拥有几百台的服务器,特征向量只有十万。两年后也就是2012年,百度的单集群规模达到了几十万,已经完全能够做到让这些机器在同一时间做同一件事情,特征向量从十万上升到两百亿!

  而当在百度达到两百亿后机器学习就到达了一定瓶颈,就算特征向量增加到三百亿,四百亿,对机器学习的帮助并不是很大,而此时拥极强存储能力的百度开始了在机器学习上的“深度学习”的分支发展,进而升级已有的人工智能大脑。

  备注:看机器处理能力有两个,第一个是看服务器规模,第二个是看特征向量大小。所谓特征向量简单理解的话就是指将文本语音图像视频等内容转化为机器能够读懂的一连串关键数据,数据越多,机器学习的就会越好,用户的搜索结果就会越精确,对用户的搜索体验效果也会随之上升,但对服务器的压力也会相应加大。百度能够仅用两年时间从10万直接飙升到200亿,足以见得百度服务器技术实力的雄厚。

  此外这一段并非只讲存储,同时也是在讲百度大脑的发展,因为有了记忆就会发生关联,进而产生决策,这是一个整体前进的过程。

  第二层:数据工厂

  作为一个人,要调取某部分的记忆,就会很自然的联想到某个词,某个画面,某个音乐等等就能记起很多事情,比如当你听老歌时,看到童年的玩具时,汹涌的记忆总会被调出来。当然这是因为人类大脑的神经连接结构允许我们这样去检索,而机器是不允许的,数据存储在硬盘上,机器想要找到某个数据,必须一个个访问过去,机器没有分类的概念,就像在图书馆中,机器是一个不会看分类的管理员,他要找某一本书时只能一本一本的找过去,十分笨拙。

  也就是说,机器要想搜索什么内容时,必须有人来帮助它建立起分类,但最矛盾的就是,在错综复杂的语言结构中,我们很难为一个词去下定义,比如当你在说“苹果”这个词的时候,你如何告诉机器他的分类?"苹果"究竟是一个名词,还是一个公司?而决定一个词的意义的则是语境,也就是机器要依靠其他词语的出现来为这个词做模糊的定义,不能完全给它下死定义而是要根据环境来下,并且它还应当是动态的,不断变化的。

  也就是说这种搜索技术也依然要百度的大脑配合才能达到,对每一个词的定义应该是一个库,而这个库中的每一个词又都各自构成库,百度的数据工厂所创造的算法,就是在这么一个数据之海中去为他们建立管理,然后去索引。

  数据工厂相当于人脑中的记忆关联过程:将某个词同时与其他词或是某个场景等等建立起动态关联的过程。

  第三层:百度大脑

  人脑有了记忆,有了关联之后就会进行决策,比如小孩子碰到开水,烫到了手下次就不会碰,就是因为记忆了开水和烫手的痛苦,并将这两个记忆关联在了一起,才有了下次不去碰开水的决策。而百度大脑就是在模仿这些行为,做记忆关联之后的决策、行动、创造。

  我之前关于开放云和数据工厂的分析完全是建立在搜索引擎之上,只是站在了百度对汉语能力的理解而已,而那时百度的人工智能也确实只是刚出生的婴儿而已,只能在PC端爬行,但是当智能手机诞生,可穿戴智能设备的出现后,百度开始成为可以走路的婴儿,此时百度大脑的智力已是高达两岁的婴儿水平。

  从搜索引擎智能到硬件智能,这是一个平面到立体,二维到三维的过程。原因是以前百度搜集到的数据只能够是PC端用户的搜索行为,这之中充其量只有文字内容罢了,百度所能够建立的仅仅只是语言理解,对用户的输入文字数据做不断的处理与反馈,但是到了手机端,智能硬件端则完全变天,百度可以收集到的不仅仅只会是语言数据,更会收集到一整套的使用场景数据!

  此时,百度从为用户提供搜索结果的搜索引擎开始转变为向用户提供全方位解决方案的人工智能,想象力无穷。

本帖地址:http://bbs.liuxue86.com/916948.html

康斯坦丁SS1

回复 2 楼 2016-09-02

解析百度大脑

百度大脑

  那么,百度大脑将会如何模仿人类的感知,再到思考,以至于最后产生决策、生产、创造呢?

  感知部分:

  这里,我们还是先回看百度在PC时代的处理方式,百度通过海量的用户输入的相同信息,以及他们对网页的排序进行的点击,加上自身算法的种种规则,进而对搜索结果进行排序,将最优的结果前置于用户面前。那么以此类推在移动时代,百度能做的则是,通过海量的用户的发起行为,然后根据他们最后的选择行为,再根据用户的周边环境场景,建立起强大的数据关联,进而再为其决策。

  而这里的感知则与PC时代完全不同,PC时代感知的只是某个词汇数据,但是这里感知的有两者:第一是用户的交互数据,用户对机器做了什么,说了什么,输入了什么图片,人工智能会将这些行为转化为机器能够理解的特征向量等数据输入进机器。第二是物的数据,场景数据,比如用户拍照中的场景,百度可以对其进行智能识别,判断其在哪里,是在餐馆还是在旅游途中等等,并也将这些场景转化为机器能够读懂的特征向量等数据,让二者进行一些必要的关联。

  当然这些收集行为和PC时代一样都是匿名的,百度根本不在乎任何一个单用户的信息,百度在乎的是群体的决策信息,并利用这些信息进行判断后再为个体用户作决策推荐。

  思考部分:

  同样是类比于百度在PC时代的思考方式,百度拿到用户搜索的数据,再拿到网站的数据后为语词进行了相关性关联,为其进行了群体模糊解释,那么毫无疑问,百度会为其感知到的信息再次进行模糊解释,将感知到的信息进行与其他感知的关联处理,并且还会将之前已经在搜索引擎上积累的信息融合进来,进而为人类整体行为做出解释,并为个人想要选择做某些事情的时候提供最优方案。

  就像婴儿牙牙学语一样,开始观察周围大人的说话与表情,并在自己的大脑中建立这一切的关联性,开始尝试学习大人说话的内容,并说出来。

  决策、生产、创造部分:

  同样是类比于百度在PC时代的思考方式,百度所做的决策就是帮用户提供最优的搜索结果,然后前置。那么也很好理解百度大脑在移动设备时代会如何帮助用户决策,百度会根据各个已经在数据库中已有的常规用户行为场景,再为某个用户提供具体的方案。

  当百度大脑的思考过程执行完毕后,就完成了对某件事的动态理解,而理解完后就要去为用户产生最优质的结果,并再根据用户的反馈进行不断调整。

  就像婴儿一样,虽然还在牙牙学习,但是已经开始在用积木搭建自己的城堡了。

美妆美瞳55

回复 3 楼 2016-09-02

百度的“新”核心 人工智能

人工智能

  百度的“变”

  在今年4月份,百度宣布进行组织架构调整,对各个业务线进行调整。关于这次调整的原因,百度董事长兼CEO李彦宏解释为,百度的人工智能,特别是深度学习方面的技术,正逐步在百度各个领域发挥出无可替代的作用,百度将积极发力于人工智能领域。

  在今年的联盟峰会上,李彦宏也提到人工智能是互联网发展的下一幕,并且百度也将一直做着这方面的尝试。目前,百度通过成功将语音/图像识别与搜索、无人车、机器翻译等人工智能技术植入到各条产品线投入使用,受到业界乃至海外市场的广泛关注。

  以今年大热的无人车为例,百度的无人车已经可以像正常车辆一样加速、并线、超车,并且以“三年商用、五年量产”为战略目标,正在顺利推进商业化进程,本季度先后与芜湖市政府、上海国际汽车城、浙江乌镇景区达成战略合作,拓展无人车实际运营的试验空间,并在安徽芜湖打造出国内首个全无人车运营区域。

  此外,百度人工智能技术已经从实验室走入到生活场景当中,今年4月度秘机器人就已经进入肯德基概念店,通过多轮交互为用户完成从点餐到支付的全流程。并且在高考季,度秘为全国近一半考生提供高考一站式服务,从考前模拟、考后估分、填报志愿、到录取查询。

  可见,百度的业务尤其在人工智能方面呈现出生机勃勃的发展势头。依靠大数据和人工智能的技术优势,今天的百度正在变化,而且是向好的发展。

  百度的“不变”

  在移动互联网发展过程中,核心不再是信息的传递,而是更有商业价值的服务。PC时代,人们只满足于人与信息的链接,所以简单的搜索是可以满足用户的;移动时代,人们注重的是人与服务的链接,希望产品能够直接帮其连接所要的“服务”。百度搜索帮助用户链接信息及服务,为用户提供更加便捷、智能、个性化的搜索环境。

  此外,除了对于搜索业务的未来发展布局,面对现实问题,百度也进行了大范围调整,比如严控在搜索结果中商业推广信息占比不超过30%,全面清理整顿医疗商业推广服务,采用“机器+人工+人工”三道物料审核机制,力求从源头保障信息真实有效。同时,百度升级网民权益保障计划,增设10亿元保障基金,引入第三方中立评估机制,共同捍卫网民利益。

  我觉得应该称赞百度的这种行为,因为百度这样做会对其收入有所影响。但是,从长远来看,从社会责任感来看,这样做是一个企业应该要有的基本准则。

  今天的百度与明天的百度

  今天,当我们谈论百度的时候,我们总会带有一丝调侃气息,但是作为一个旁观者,我们还是应该清晰地去看待和评价一家公司。

  现在的百度,从业务调整和布局来看,尤其在人工智能领域的投入,百度正在以人工智能基础平台为核心,在百度各业务体系全面开花,并转化为核心优势,百度在新风口下已经占据有利位置,有望迎来更有后劲的新阶段。

  举个简单的例子,就像十年前的BAT,他们对于门户而言,简直不值一提。但是,他们当时所做的事都是未来的事。也是因为这样,才有今天的BAT。同样,今天的BAT和其他大部分互联网公司都在做着各自认为是未来的事,这个谁也不好说。而真正能够定夺的,只有时间。

  百度如何看待人工智能?百度的人工智能现在处于什么水平?百度的人工智能会有哪些应用?对于这些问题,李彦宏在演讲中进行了解答。

  延续此前在2016亚布力中国企业家论坛夏季峰会上的观点,李彦宏认为,互联网发展的第一幕是PC互联网时代,第二幕是移动互联网,但移动互联网时代正在离开我们,而代表未来的下一幕,则是人工智能。

  百度如何看待人工智能,李彦宏表示:“人工智能是百度核心中的核心。”

  具体来讲,人工智能之于百度的具体产品是百度大脑,根据李彦宏的介绍,百度大脑由三个部分组成:人工智能算法(超大规模的神经网络)、计算能力(数十万台服务器来进行计算,基于GPU)、大数据。

  百度大脑的能力主要有四方面能力:语音的能力(语音合成、语音识别)、图像的能力、自然语言处理能力以及用户画像这四种能力。

  李彦宏介绍,百度目前在语音能力方面已经进入比较成熟的阶段,这四种能力也已经各有实用的案例。

  通过李彦宏的具体举例来看,在人工智能的具体应用上,仍然围绕百度当前的业务进行。比如,李彦宏现场举例语音识别能力帮助电话销售搞定客户、基于图像识别技术的AI能力帮助广告客户做营销。

  除了这些紧紧围绕现有业务的实际应用,李彦宏也提到了一些代表未来方向的产品,比如被频繁提及的百度无人车、度秘(语音助手,用人的语言跟人交流)等。

  李彦宏宣布,百度大脑的全部能力将对外开放,并且很多将是免费提供。

u=1408826134,3155585812&fm=21&gp=0.jpg

逆战麒麟

回复 4 楼 2016-09-02

李彦宏演讲全文

各位来宾大家早上好!欢迎来到2016百度世界。

  大家知道,百度世界是我们每年举办一次的百度技术创新大会。今年的主题我们聚焦在人工智能,大家在之前收到的请柬上已经看到这个主题了。刚才开场视频是以人工智能为主题的,今天我的主题演讲也将围绕着人工智能来展开。

  今年6月份,我在百度联盟峰会上讲了一个概念,叫做互联网的下一幕。下一幕是什么意思呢?就是说,互联网的发展在此之前已经经过了两个非常重要的阶段,第一个阶段大概持续了十几年的时间,就是我们讲的PC互联网阶段。第二个阶段是在最近四五年,我们把它叫做移动互联网的阶段。

  对于中国市场来说,随着上网人数越来越多,上网人口的渗透率越来越高,现在已经达到了七亿多,就是说已经超过了50%的渗透率,同时,每一个上网的人现在也基本都用上了智能手机。这意味着什么呢?这意味着,未来互联网的增长不能再靠人口红利来驱动了,也就是说,移动互联网的时代其实正在离开我们。这可能是很多人觉得难以接受的。

  我们国家现在进入了所谓的新常态,经济的增长需要靠“互联网+”行动计划来推动,所谓“互联网+”就是希望用互联网的思维方式、互联网的效率来推动各个行业、产业的继续发展。但是,我们互联网的从业者其实又深深地感受到了这其中的危机,这个危机就是因为过去的粗放增长阶段已经结束了。

  移动互联网之后的下一幕是什么?其实现在已经很清楚了,就是我们所说的人工智能。人工智能对于百度来说是核心当中的核心,我们也很幸运,在过去的五六年当中,百度花了很大很大的精力投入到人工智能的研发当中。

  人工智能对于百度来说意味着什么呢?我可以用简单的四个字来描述,就是百度大脑。

  百度大脑的概念我们其实在大约三年前就对外讲过。那个时候我们讲,百度大脑已经具备了大概两三岁孩子的智力水平了。自此以后,不断的有人来问我,尤其是今年人工智能突然火起来了之后,很多人来问我说,你们这个百度大脑现在相当于多少岁人的智力水平了。

  要回答这个问题其实还蛮难的,我也不知道它现在是多少岁了,因为毕竟人脑和电脑它还是有很大的区别,百度大脑虽然是一个人工智能的大脑,但是它和人正常的发育的过程还是很不一样的。

  百度大脑到底由什么构成的呢?它基本上是由三个大的部分组成的。

  第一个组成部分,就是人工智能的算法。我们有超大规模的神经网络,这是模拟人的神经元组成的网络,但其实我们也不知道真正人脑工作的原理是什么,只是想象当中应该是这个样子。我们还使用了万亿级的参数,人脑的神经源大概是千亿级的,我们也有千亿的样本和千亿的特征进行训练。整个这些东西组成了百度大脑当中算法的部分。

  百度大脑的第二个组成部分是我们计算能力。现在我们已经使用了数十万台的服务器来进行计算,而这当中很多的服务器不是传统基于CPU的服务器,而是基于GPU。早年的时候,GPU主要在游戏等领域使用得比较广泛,在人工智能、尤其是深度学习起来以后,我们发现,其实GPU特别适合人工智能的计算,尤其是深度学习的计算,一块GPU可以顶100个CPU的计算能力。

  百度大脑的第三部分是数据。数据也非常非常重要,而且这个数据量也是非常大的。比如说,我们已经收集了全网上万亿的互联网网页内容,这其中包括了很多视频、音频、图像,这些数据也是数以百亿级的。我们还有每天数十亿次网民的搜索请求,而且还有每天数百亿次的网民定位请求,就是说这个人在什么地方,这样的请求也比大家想象得多,每天都有好几百亿次这样的定位请求。

  有了算法,有了计算能力,有了数据,百度大脑就可以开始工作了。百度大脑又到底有什么样的功能?让我们来看一看。

  我们今天想重点介绍的四个功能:

  一个是语音的能力,一个是图像的能力,一个是自然语言理解的能力,还有一个就是用户画像的能力。

  这几个能力虽然都是属于人工智能中比较典型的应用,但是它的发展阶段也是很不一样的。比如说语音,现在就已经进入了相对比较成熟的阶段,在很多很多领域中都开始进入实用阶段,识别的准确率也已经很高了。图像最近几年也有了长足的进展。这两者都属于人工智能当中认知的部分,所以深度学习的算法非常适合处理这些形式。

  相对来说,自然语言的理解、或处理能力就更加难一些,并处在一个更加早期的阶段,因为它除了认知方面的能力之外,还要求有推理、规划等等能力,才能够真正地理解自然语言。

  用户画像的能力,其实从传统意义上来讲并不是人工智能的领域,但是由于近年来大数据的发展,尤其是大型互联网公司有能力搜集很多用户的数据之后,再用人工智能的方法、用机器学习的方法,就可以把一个人的特征描绘得非常非常清楚。所以今天,用户画像也变成了人工智能、或者说变成了百度大脑的一个重要功能。

  下面我就分别来讲一下这几个功能,这几个百度大脑的功能。

  我们先看一下语音,刚才也讲了应该说今天人工智能发展的最成熟的一部分能力,而语音又分成两个方向,一个是语音的合成,一个是语音的识别。

  我们先看看语音识别。今年MIT Technology Review(《MIT科技评论》)杂志,把百度的Deep Speech 2评为“2016改变世界十大突破技术”,这就是百度的语音识别引擎,它已经到了第二代,主要就是使用了深度学习的能力。这样的一个技术已经可以把语音识别的准确度做到多少呢?大概可以做到97%的准确率,这样的准确率已经达到、甚至有时已经超过了人对语音的识别能力。

  当然,我们讲这些能力不是为了简单地去炫耀这个数字有多好,我更感兴趣的是,当你有了这些能力时,它可以在什么领域应用,又可以在哪些方面帮助到我们,这其实才是最最让我们觉得兴奋的地方。

  我个人的想象力很有限,整个百度几万人的想象力也是有限的,但是这些能力如果赋予到很多很多人,赋予给几亿人、几十亿人,这个可能性几乎是无限的。先用我们比较有限的想象力来给大家举一个例子。

  这是一个销售、电话销售的例子,是一个To B的应用。这个应用是什么意思呢?很多的公司其实都有电话销售这样的一个部门,都需要这样做。但是销售,尤其是电话销售这个行业,大家知道流动性是比较大的,很多销售都是新人,新人的话就会经过一定的时间培训才能够上岗,但即使是经过培训的话,也不一定有那些有经验的销售那么出活儿、出单。

  其实有经验、最优秀的销售和一般、较差的销售相比,在效率上有非常大的差别。我们怎么才能够让新手、让没有经验的销售,能够具备最优秀销售的销售能力?

  过去的做法是,把优秀的销售经验总结成册子让大家去学习,让这些销售去背,但是怎么活学活用还是需要一个过程的。而有了这么高精度的语音识别能力之后,我们就可以彻底改变这样一个状况了,甚至可以让一个刚刚上岗一个月的销售就具备最优秀销售的能力,也就是说,我们可以通过实时的语音识别甄别出用户或客户在问什么问题,然后我们再实时地在屏幕上告诉新的销售,最优秀的销售是怎么回答这个问题的。

  过去没有实时的语音识别的时候,你需要线下学,学完了之后上去用、很容易就忘了,但是有了这个系统之后,我们就可以解决这样的问题。

  我们来看一下这个案例。

  【播放语音识别技术演示视频】

  大家看到,在刚才的过程中,百度大脑一直在实时地识别双方的对话,尤其是从电话里面传出来的声音,有的时候并不是那么清晰,对于人来说要完全听清楚每一个字其实都是有一定难度的,但百度大脑的语音识别能力已经可以做到非常精准,并且可以根据用户的问题、实时推荐下一步的工作要怎样应对,这是一个语音识别应用在企业日常运作中的一个例子,就像我刚才讲的,应该还有很多很多应用场景,大家可以根据自己的背景去想象。

  语音识别是一方面,语音合成又是另外一个方面。语音合成是什么意思呢?就是机器可以把文字转换成语音,把它念出来、读出来。今天的语音合成也有了和过去非常不一样的体验,最主要的就是,它可以用比较自然的人的声音读出来,而不是像过去机器一样,每一个字之间的停顿都是一样长,是匀速的、没有表情的。这样的自然体验,当然对于用户的黏性来说也是有很大的作用。

  现在,百度每天要响应2.5亿次的语音合成请求,这些请求用来干什么呢?比如说,过去人们看小说,今天可以在手机百度里面听小说。慢慢的人们听小说的时间也更长了,过去每个人平均在小说频道会花大概四十分钟左右的时间,现在要花将近两个半小时,就是因为把计算机合成出来的语音读出来给我们听,确实是一个很不错的体验,甚至是一种享受。

  那么这种读出来的小说,和我们平时听到的广播有什么本质上的不一样?其实非常不一样。广播是每一个人听到的东西是一模一样的,而今天的语音合成,它可以做到每一个人听到的东西都是不一样的,完全根据你个人的需求进行定制,这就是为什么它的(用户)黏性会很高,它能够具备自然发声的能力。

  不仅如此,其实我们可以想象一下,它如果能够模拟一个自然人的表达方式或发声能力,它就可以模拟任何一个你喜欢的人的说话方式。

  不知道有没有人注意到,百度地图里导航功能就是用语音来进行的,其中有一个选项可以用我的声音进行导航。其实导航的那些话我并没有说过,机器只是根据我平时说话的情况合成了一个李彦宏的声音。这样的声音不仅在我身上可以做到,在很多其他人身上也可以做到。

  我们现在来给大家展示一个合成的声音。我们合成了一下13年前已经去世的张国荣的声音,我们来放一段video。

  【播放情感语音合成视频】

  为什么给大家展示这个呢?一方面我知道,很多人是张国荣的粉丝,另一方面,其实合成张国荣的声音比合成一般人的声音要更难。为什么呢?因为他的国语语料相对来说比较少,所以,我们能够合成他的声音,就一定能合成很多很多人的声音。

  对于百度来说,百度大脑的语音合成能力可以让每个人都有自己的声音模型,你只要按照我们的要求说50句话,我就学会了你说话的方式。当你拥有自己的合成声音之后,比如说家里的老人想经常听你说一说,你把这个声音合成出来让他听就好了。或者说你平时要加班,小孩睡觉之前想听个故事,你合成自己的声音给孩子讲一遍这个故事,听起来也会很亲切。所以大家可以看到,这些语音的能力会带来各种各样新的可能性。

  下面我给大家讲一下图像。用一个比较专业的术语来讲,我们叫做计算机视觉。这也是现在广义的人工智能中非常重要的领域。

  说到图像的识别,我想大家自然而然会反应出来一个什么应用呢?应该就是我们通常讲的人脸识别的应用。人脸识别的准确率今天已经达到了99.7%,已经非常非常准确了。

  现场的屏幕能够识别出来我们一些嘉宾,根据他们的人脸,我们知道这个人是谁,这个准确率已经比较高了。刚才进来的时候,大家也可以看到一些人脸识别的展台,我们是可以识别很多很多人的面孔的。

  那么,人脸识别这个技术是怎么实现的?我们要对人脸的特征提取它的关键点,把这些点打出来之后要做一些处理,把它连成一个面部表情,据此来识别这样一个人。这就使得当一个人的表情发生变化的时候,我们仍然能够识别出来这个特点是没有发生变化的,比如他在哭,他在笑,他在愤怒,他在迷茫,他的表情是不一样的,但是他的表情特征是不变的,所以我们仍然可以很准确地识别出这样一个人。

  除了面部识别之外,图像识别还在很多领域也有应用。我们再看一个,这是上海的一个全景图,大家使用百度地图有时候需要看这样一个景,到一个陌生的地方之前,想看看到那看到的样子是什么。

  当然,这个图不是一个简单的图像的采集,我们采集了图像之后要对图像中各种各样的目标进行识别,这个大楼是什么样的大楼,那个路牌上面写的什么字,对写的这个字识别的话,跟人脸识别还不太一样,这里面有一个特殊的图像识别的技术就是OCR,这个是二十多年前我们的一个专利,到今天它的准确率已经非常高了,下面我们也是用一段视频给大家看一下百度地图是如何利用图像识别的。

  【播放百度地图视频】

  这是百度地图利用图像识别的情况,其实还有一个很重要的领域也是非常需要图像识别的技术,这个领域是什么呢?这就是我们过去一年来讲得比较多的无人驾驶汽车。无人驾驶汽车涉及到很多很多的技术,比如说我们需要计算机视觉的技术,需要高精度地图,需要对环境的感知,需要定位,甚至需要语音的通话。

  但应该说,计算机视觉或者是图像识别的技术是“最后一公里”,无人驾驶汽车真的要变成没有人,真的要能够解决99.999%、甚至100%的情况,最终还是要依靠计算机视觉的能力,要识别各种各样的极端的情况。

  去年年底开始,我们给大家展示过百度的无人车在五环上跑,在高速上跑的情况,过去一年左右的时间我们也花了不少精力去提升我们在城市道路上运营的水平,下面我们也放一段视频给大家看一下。

  【播放无人车视频】

  大家看到左下角这是人能够看到的视野,这个视野其实是比较窄的,主屏幕是无人车能够看到的路面情况,大家可以感受到,它感知的范围其实比人要宽了很多,很多比较远的目标都可以感知到,每个目标都给出它唯一的编号进行识别。

  对面有什么车过来了,遇到红绿灯,遇到障碍怎么办,行人怎么能识别出来,或者是树木,周边的汽车等等,每一个目标我们都进行了识别和编号,这就是实际的、一个百度无人驾驶汽车在城市道路中行驶的情况,上面的45是限速。

  这是大致的一个车看到的世界是什么样的。这里面涉及了很多计算机视觉或者是图像识别的技术,尤其是这两个技术:

  一个是我们叫做车辆的检测,你行驶过程中怎么能够知道旁边有车辆,这个车辆在哪儿?这个车辆的检测我们现在按照国际权威的评测来看,车辆检测的能力,百度无人车已经排名第一了。

  还有一个很重要的能力是车辆跟踪的能力。这个不仅是全自动的无人车,即使是对半自动的、高度自动驾驶来说,也是一个很基本的能力。你怎样能够准确地跟着前面的车走,这个技术在包括准确性、全面性、连续性等六项指标中,我们已经有四项拿到了第一。

  这是无人车对于图像识别依赖的情况。我们再给大家展示一个领域,就是增强现实AR,AR其实也是非常依赖(图像识别)。拿着手机拍一下现实的情况,我们要能够识别出来这是哪,这里面有什么,然后才能跟用户进行互动,才能产生真实世界和一些虚拟世界的完美的结合。

  那么这个东西有什么应用呢?我们也觉得很高兴我们的周总、我们的广告主非常敏锐地把握到了这么一个机会,他说OK,我可以把现实世界中我的产品和虚拟世界中我希望用户感知的东西结合在一起,这样的一个做法也可以说是一种新型的广告形式,下面我们就来看一个具体的例子。这是我们跟欧莱雅中国合作的一个例子。我们放视频。

  所以大家看到,无论你拿手机拍一张明信片,还是拍一个实物的洗发水,它都可以准确地识别出来这个东西,和用户进行互动,这里面不仅有图像识别的技术,也很大程度上取决于广告主的创意,如果创意和这个技术结合,对消费者的吸引力也非常大,所以我们也期待将来的时间和客户很好地合作,把这个创意,把最优秀的想法和最优秀的技术结合起来,给消费者带来实惠。

  这是有关图像识别方面的几个例子。下面我们再看自然语言处理。自然语言处理其实我刚才也讲了,它的成熟程度应该不如语音,甚至不如图像识别,但是即使在目前的状态下,它也能够给大家带来很多很多不一样的体验。

  最直接的例子应该是我们去年在百度世界大会上讲的一个例子,就是度秘。度秘是一个个人智能的助理。这个个人智能助理今天我们可以在手机百度里面找到,度秘跟用户进行交互,现在已经有超过一半的交互是通过语音和图像来完成的,去年我们也讲了,语音和图像将来会变成一个主流。

  度秘除了它能够识别语音和图像之外,其实它更关键、更核心的技术,是能够用人的语言来与人进行交流,并且能够理解人的很多意思和意图,尽管不是每一次都能理解。

  过去这段时间我们也利用度秘的自然语言的能力做了一个比较有意思的应用,用度秘来解说奥运篮球,下面我们看一下视频。

  今天我们全面展示了百度大脑各种各样的能力,我觉得,而在我自己和百度同学的想象范围内,这些能力能做的事情已经很多了,但是更让我兴奋的是如果这些能力赋予到全社会的每个人,它能够变换出来无穷无尽的可能性。

  所以,百度大脑会把语音、图像、自然语言理解和用户画像等能力完全开放出来,并且在大多数情况下这些能力会是免费提供的。有了这样的能力,有了开放共享,将给各行各业的人群带来过去大家做不到的、不敢想的能力。我在这里也邀请每个人重新想象你所在的行业,重新想象中国经济,重新想象世界的未来。

  谢谢大家!