如果你天天觉得公司会死,公司反而会越做越大。
人工智能是“披着狼皮的羊”
我们现在说起人工智能觉得很神奇,甚至对它产生一定的恐惧。网上有一个段子说我是“人类反抗军最后一个人工智能的工程师”,实际上没有那么可怕。如果用一个老百姓的话来说,人工智能基本上是一只披着狼皮的羊,看起来很可怕,其实没有那么可怕,它是很有益的,可以为人们所使用的。
今天百度做的自动翻译,就是底层的人工智能技术,已经快要进入实用状态了。刚才有位领导坐在我旁边,我们聊天谈到“将来人工智能可以替代什么职业?”,其中一个职业很有可能就是翻译,不论是同传还是随行翻译,将来这个职业可能就不存在了。技术会不断替代各种各样的东西,一方面它确实会给人们带来一定威胁,但另一方面也不断地给人们带来收益。最后,也许用共享经济的模式能够让人们最直接地从技术的进步当中获益。
百度做搜索起家。在10、15年前,搜索背后的技术基本上就是一个简单统计,搜索一个词,出现这个词频率最高的网页就是搜索结果。后来我们发现了超链分析,链接中出现这个词的频率最高,才会排到前面。大约7、8年前,我们发现其实用户行为更可以反映出哪篇文章更相关。于是百度就开始投入人工智能的研究,机器学习就是人工智能的分支。
现在用百度和10年前用百度的感觉似乎是一样的,但背后的技术完全不一样,现在的百度搜索是利用机器学习技术,或者说是人工智能技术在支持它。2012年开始,我们意识到深度学习这个技术即将进入爆发期,所以开始重兵投入。2013年1月份,我们正式对外宣布成立了全球第一个深度学习研究院IDL,之后就在自然语音理解、机器翻译、语音识别、无人驾驶汽车、图像识别等领域展开研究。
我们现在已经取得一定成就,比如我拍一张照片,机器就可以根据这张照片作一首诗,这是因为机器可以识别这张照片,然后根据识别结果进行创作,其实机器不是真正理解后进行的创作,而是根据网上无穷无尽的语言材料进行创作。
很多在人看来比较简单的东西让机器学起来比较难,在人看来比较难的事情,机器学习起来反而容易。比如机器下围棋是容易的,机器开车就是难的。让人达到围棋九段很难,让人拿到驾照就相对容易。还有很多很多看起来很简单的东西,需要机器去克服。克服之后,简单的脑力劳动逐渐就会被机器所替代,工业革命替代体力劳动,大批手工业从业者会失业,但同时也创造了更多就业机会。未来人工智能革命也是一样,会替代很多简单的脑力劳动,但是也会创造很多新的机会。
我们非常愿意将技术共享出来,让大家一起使用会让技术进步更快,有很多人过来调用我们翻译的东西,我们就可以看到需求,看到他们为什么要解决这个问题。如果我们解决得不好,我们就会想怎么能解决地更好,所以这些东西共享越充分,进步越快,进步越快大家受益越大。这不是一个游戏,今天会议的主题是“共享”,不仅是数据的共享,技术共享也是非常重要的。
战争与商业推动创新
科技的创新背后一直有两个非常大的推动力,不知道是否有人注意过。我问过很多搞科学、搞企业的人“您觉得某一种巨大的创新,到底是怎么发生的?是不是这个科学家非常理想主义,没有任何其他力量的推动,突然脑洞大开就想到这个东西?”很多人告诉我说,他们就是这样的人。但在我看来,有两个非常大的推动力量是绝对不能忽视的:一个就是战争,比如图灵。图灵之所以有那么多的创新,其实是一战、二战的时候不断因为战争的威胁。人毕竟还是惧怕死亡,在惧怕死亡的时候就特别能够激发创造性,产生很多很多新科技;还有一个就是商业的力量,我们今天不能鼓励战争,但可以鼓励用商业力量推动科技进步。
好几百年之前,哥伦布发现新大陆,不是因为他一个人有这种intellectual curiosity(求知欲、好奇心),所以就发现了占整个地球20%多陆地面积的新大陆,而是他后面有商业力量的支持。他最早去找葡萄牙王室,被拒绝;找英国王室,被拒绝;找法国、意大利,后来又找葡萄牙都被拒绝。最后西班牙王室决定资助他,这样他才能够有那么大的舰队,带着那么多科学家走那么长时间。
很多科学的进步,背后都是有商业力量推动的,我们做企业的其实就是应该思考,怎么用我们的商业力量来推动科技的进步。而这里面竞争又是非常关键的东西,如果没有竞争,谁都不会有那么大的劲头天天这样做。战争是死亡对你进行威胁,商业竞争在某种意义上其实也存在死亡的威胁,只不过这个死亡是企业的死。如果说觉得这个公司不会死,它可能慢慢真的就死了,你天天觉得公司会死,这个公司反而会越做越大。
刑波:若人工智能研发是登山,我们都经历了什么
图灵机的概念极大影响了人们关于人工智能对于功能的定义
最近谷歌的AlphaGO和韩国围棋选手李世石进行了“人机大赛”,结果以大比分取胜,这在公众舆论界形成一次惊恐或者说是恐慌。我看到的一个情况就是:人工智能从教科书里面或公司高度机密的研发部门的一个高度专业工作,变成受到公众和舆论巨大关注的题目。我本来想讲一些技术上的工作,但是这次,我不得不承担这么一个义务来解释一些误解,同时有一些事情也要以正视听,把人工智能和人类影响、关系,给大家讲一下个人的看法。
人工智能源于人们对智能机器的梦想
首先,我要简单的回顾一下人工智能起点。人工智能起源于人们对于智能机器的梦想,早在亚里士多德就曾经说过,如果一个机器自己能干很多有用的事,岂不是可以让人类解放出来,我们可以不用奴仆,不用工匠,就能做成很多事情。他的观点是相当乐观、积极的,他希望机器能够完成人类的一些功能。
人工智能正式成为一门显性的、严格的、系统的、可实现的科学和工程的一个领域,得益于上个世纪逻辑科学、计算机科学、信息论、控制论很多学科的发展的交汇。而在人工智能的发展里面,有很多故事,都令我想起我年轻的时候一段很难忘的经历。在我大学三年级的时候我心里面有一个梦想,我希望能够成立一个登山队,到西藏爬一座从来没有被征服过的处女峰;这座山找到了,就是在长江源头唐古拉山的主峰,叫格拉丹东,我想踏上这个山顶。
像这个经历一样,人工智能的发展也来源于梦想,来源于志同道合的人。而梦想就是图灵的“图灵机”的概念。他认为有可能制造这么一台机器,通过某一种电子媒介或其他的媒介跟人进行交流。如果人在跟这台机器交流过程中并不能判断它到底是不是人的话,我们也许就可以下结论说这个机器获得了跟人一样的智能。在这一概念的带领下,60年前一批有共同愿景的人在美国达特茅斯大学开了一次会,希望通过交流来确定人工智能作为一门科学的任务和整个的路径。我们普遍认为这个会议标志着人工智能正式诞生。
当然,我们的登山队也在某一个时刻诞生了,他们就是一群志同道合的人,就像开那个会一样,我们聚到一起,组成的队伍进行了很多训练。我们把这件事看得很神圣、也很严肃,我们经过疯狂训练以后也匆匆忙忙的上路了。我们上路的时候,你可以看到用的是非常原始的手段,跟现在登山队很高大上的越野旅行很不一样。我们到青藏公路拦截运输货物的卡车,坐在车斗上,然后到了某一个地方,换上马匹就开始向高原进发。当时形式非常乐观,大家都憧憬有一天站在山脚下开始我们的登山旅程。同样乐观的气氛也在人工智能早期诞生后的那几年里面弥漫着整个学界。贝尔曼公式的发现,感知器的发明都使人们认为,以这样的速度往前发展的话,也许人工智能在不久的将来,真的就可以代替人类。
人工智能的定位:实用性与功能性
但是,毫无疑问这个前途并不是那么顺利,像我们登山一样,我们上了高原以后很快就遇到很多困难。比如,我们马上就遇到自然屏障,像大河、沼泽地,我们得想办法去穿越。我们甚至还走丢了几次,有几位队员迷路了,所以不得不停下来等他们,去找他们。我们的给养相当的匮乏,粮食也不够,马匹也不够,所以很多东西都要自己来背。同样比较悲惨的场景其实也发生在人工智能研究里面,我们管它叫做“第一次人工智能的冬天”。怎么回事呢?终于有一天人们发现因为理论和算法上的两个局限,导致机器只能做很简单的、非常专门很窄的任务,稍微超出它们所预期的范围以后就没有办法对付。这就使得人工智能在很早期发展过程中遇到难以克服的瓶颈,不可能去实现一开始所保证的目标,比如接近人类甚至超过人类,所以第一次冬天很快到来了。
当然,这一批天才并没有泄气,他们还是继续往前艰苦行进。经过寒冬以后还是重整旗鼓做了一些新的工作。一个标志性事件就是,大概在80年代卡耐基梅隆大学制造了一个叫“专家系统”的东西,这是一个巨大的成功。这个“专家系统”帮助这个公司每年都可以节约4000万美元左右的费用,它可能在决策方面提供更有价值的内容。同时受到这种成功的鼓励,很多国家包括日本、美国都再次投入了很多资金,开发所谓第五代计算机,他们管它叫做人工智能计算机。
很不幸的是寒冬又一次来了,这一次是由于公众和政府兴趣的转移,甚至包括一些竞争对手的出现。比如说像苹果公司、IBM开始推广台式机,计算机开始走入个人家庭,不是大机房设备,费用远远低于专家系统所使用的机器。专家系统被发现是相当古老陈旧,非常不方便的这么一种设备,非常难以维护,成本非常高,而且不容易延展到新的任务上去,所以经过了一段时间的使用以后,大家的热情开始冷却,政府经费开始下降,所以寒冬又一次来临了。由于这些严重的困境,人们开始思考人工智能到底往何处走?应该怎么来做这个东西?一个很自然的问题就是我们要实现什么样的人工智能?什么叫智能?
拉回到我们爬山,我们也在思考,我们要把任务完成,我们给自己设定很难的目标,经过几个星期艰苦跋涉,终于到达了山脚下。这个山脚就是在格拉丹东这个冰川的正前方。然而要实现登顶,我们必须考虑采用何种路径,我们决定从冰川的左沿踏上雪线,我们感觉我们找到了一个比较靠谱的道路。
大概在同一个年代,人工智能整个研究也开始重新确定自己的方向。我们也是做了一个选择,就是我们要做一个实用型、功能型的人工智能,因为这样我们会对结果会有一个比较严格的判断,而且我们能搞到经费,这样的话我们能施展一些功能。这就导致了一个新的人工智能的路径。由于这么一种对于人工智能任务的明确和简化,带来了一次新的繁荣,数学算法和工具都有了新的突破,IBM深蓝和卡斯帕罗夫的象棋大战就是在这时发生的。最重要的是,我们终于把人工智能跟人类其他工程技术方面上的成就做了很紧密的连接,摩尔定律的实现使得计算能力越来越强大,这些强大的计算能力很少被使用在人工智能以前早期应用中。现在由于我们把人工智能定义为一个数学上的解题过程,这样我们就可以把很多计算能力转移过来提高人工智能的效果。
变革传统,人工智能迎来新突破
这些突破似乎使得人们又变得很乐观,但事实上我们又遇到了困难,爬山的时候也遇到了困难。困难在哪儿呢?
困难发生在2011年我在facebook公司做学术休假的时候。在当时接手的项目中出现了一个问题,不同机器在执行全局任务时的困境:首先,它们各自得做自己局部的运算,但是它们因为是在完成一个共同的任务,它们需要做一个握手,能够达成一致性,所以需要来一次通讯,那么这个通讯是必须发生在每台机器把它们的子任务完成以后才能通讯。所以每次我们都可以想象需要有一个等待的时间,让所有机器都完成它们的任务。这就导致每一次迭代循环的时间都是由最慢机器决定,但因为哪台机器最慢会经常变化,这就很难实现计算机的加速。这个困难相当严重,以致于到我当时做访问教授结束的时候还是没有解决,所以当时走的时候还是比较沮丧的。
我们在爬山也有类似沮丧的时候,比如说我们遇到很多冰裂缝,爬不过去。我们也遇到了暴风雪甚至雪崩,后来在山上也迷了路,各种各样的挫折使得我们目标离我们好像更加遥远了。
这个时候可能开始重新思考到底我们目标是什么?我们到底需要什么来达成这样一个目标?从人工智能角度来讲,我们需要完成大型的任务,需要用一个严格的数学上圆满的方法来实现这么一个目标。到底我们需要什么呢?后来我们发现,光有好的模型是不够的,这就像从最原始达芬奇设计的飞机,到后来的螺旋桨飞机、喷气式飞机,它每一代的设计都伴随着它引擎的变化,必须要有助推器把它驱动起来,我想这就是当时人工智能发展中遇到的一个瓶颈。
所以我们意识到这个问题以后,我们就想是不是把引擎这个事情好好看一看。我们发现,人工智能运算和传统计算非常不一样,传统计算由一堆指令集构成。就像搭房子你要是把哪一块砖放错了,你一定得重新放,否则整个东西都会垮下来。但人工智能运算跟这个很不一样,因为人工智能也是一个程序,好象也是一堆指令集,但是这里执行指令集只是一个过程而不是目的,它目的是为了解一个优化方程,就像爬座山一样,目的是爬到山顶。你固然可以沿着它给你设置好的路径一步一步爬,但是如果你哪一步走歪了,但只要他大致靠谱,知道目标且能判断好坏,他还是可以爬到达山顶,只不过是稍微慢了一点,但是总比每次走错了以后再走回原点重新爬要快很多。这就体现了人工智能作为一个迭代渐进算法跟传统的一次性的扫描算法所不一样的地方。因为这样一种认知,我们终于迎来了新的理论突破,在2012年的时候,我还有几位同事设计一种叫做参数服务器新型的系统模型。我们更把一个并行人工智能程序当成是一个在执行救火任务的机群,它的任务为了扑灭火,编队飞行去达到火场只是一个手段,编队飞行很好,但也不用不惜代价的保持飞行姿态的完美,你到了目的地,把灭火剂扔掉,再很有效的飞回去补充,再返回参与下一轮灭火,直至熄灭,这个是最主要的一个目标。所以,这两个是不一样的。
在这个构架下,我们实现了很多突破,如有限异步模型和动态调度器的设计。由于这一系列的成果,我们感觉是在一个正确的路上在走,我们的确跟这个目标开始接近了,我们爬山的活动也类似经历这样一个过程,我们开始向峰顶接近。
人工智能算法任务就像登山
我们的登山活动还是有一个光荣的名字的 —— 清华大学登山队就是从我们那次活动开始成立,我们很自豪,能把自己的小小梦想跟一个很响亮的名字联系在一起。在这个活动中我们也遇到很多缘分,发现有时候不期而遇、没有事先计划的好事,也会对研究或对我们的活动产生一些很正面的影响,比如我们的系统命名。
任何好的系统都需要比较有意思的名字,到了需要在2013年的年底做第一次开源发布的时候,我们突然发现还没有起好名字,大家也都想不出来一个很好的名字。通常在计算机业界里面,名字都比较无趣。但我感觉还是希望有一个更隽永、更有意思的名字。有一天我从办公室开车回家,我还在想这个事,我突然就想到,我们的调度器简称是Strads,是意大利传奇的“斯特拉迪瓦里”小提琴的简称。所以我突然跳到这样一个思路,我不是用小提琴来构思协调的形态吗?小提琴显然是很美好的乐器,我当时就感觉到我这个系统能够把机器学习跑成这么一个节奏,又优美又正确,还能让人兴奋,那是一个非常好的效果。而我最喜欢的曲子名叫《无穷动》(Moto Perpetuo, or Perpetuum Mobile),是帕格尼尼给小提琴创作的一个难度非常高,但又是一个非常技巧性和优美的作品,所以我就取了它一个字头,把它叫做Petuum,这就是名字的由来。
我们由于各种各样的机缘、努力、运气,在学术上和我们个人的活动上,都达到了一定的高度。比如我们已经爬到了一个相当高的山脊,我们也看到了不可思议的美景。我们看到了更多的山峰,我们的课题也在不断的生出新的枝叶来。比如我们开发了面向多任务的灵活的资源配置系统;而我们又关注解决办法的部署,于是发明了分布式容器技术;最后系统内存的数量级,又设计了许多使整个平台变得轻便可用的解决方法。而这些不同角度的设计就成就了最后一个最佳的解决方案。它就是我们现在所打造的这个Petuum数据中心操作系统。
我们用Petuum最后还是回到了原点,当时在Facebook我们用1000台Hadoop机器跑1亿个节点的网络,基本上需要跑400个小时,所以我们当时没有跑完,我们只是预期它跑400个小时,实际上可能比这个还要长。但这次我们有了一个突破,1亿个节点的网络,只用了5台Petuum的机器可以在37小时之间计算完成,得到一个非常有意思的社交群可视化结果。这还是一个比较成功的经历。
最后,让我解释一下登山为什么会放在这儿?我觉得它跟我从事的事业还有很多相同之处的。人工智能算法本身这个计算任务像登山,它是有明确的目标的,可以用数学描述的目标,它本身有弹性、容错性、随机性。如果你能够很好使用这些特征和机会的话,你就可以获得事半功倍的结果。人工智能领域的发展也像登山,它有各种各样的起伏,有各种各样的思路的跳跃和重新的定位,一个好的解决方法,通常对于任务目标、数学模型、计算引擎有比较全面精确掌控和实现才能达到目的。而如果你对它设置一个像类似科幻不切实际的目标,或者是一个模糊的路径、错误的定位,都会导致挫折,就会像人工智能的前几次冬天一样。从我角度,大家固然会说冬天和夏天是一个不可逆转的潮流,那我还是希望至少在我有生之年,我不希望再看到一个冬天,能够把人工智的辉煌继续下去。
机器会超过人,但人工智能不会代替人
这里有一个小小的后记:从西藏爬完山回来以后到清华大学我们面对了非常出乎意料的反应,大学官方不太赞成我们的举动,认为我们违反了规则,由于种种原因我们每个人都得到的了一个处分,我本人的考研资格都失去了。当然这也没有太大影响,索幸就出国深造去了。
有时候你做成一件事以后,外界反映的确有出乎意料的一些结果。关于人机大战让人感到恐惧的评论,我不知道这个东西怎么理解,我还是引用我一个好朋友加上同事(目前是Facebook人工智能实验室主任) Yann Lecun的话:“有些人是因为对人工智能的原理不理解而导致威胁论,有些人是为了个人名望而宣扬人工智能威胁论,有些人则是为了商业的利益推动人工智能威胁论。”所以,各位在读这些东西的时候,还是应该把这么一个背景给考虑进去,不要被这些观点去随便的误导,它们有一定的道理,但是还可以看一看其他的观点,这块可以分享一下我的观点,我认为人工智能和人类对决不是什么大的了不起的事,人类和机器对决自古就有,但是世界运转如故。大概在同一个时代有人发明了照相机,当时有人惊恐,照相机来了以后画家就失业了,但是现在画家还是活的好好的,甚至新的艺术形式也被创造出来了。
人机大赛放在这么一个背景下,它只不过是我们在技术上的里程碑,展示了人类智慧的力量和功能,我们可以以欢迎的心态接受它。当然我们的确是对它的功能的边界有一些憧憬,但是它到底会不会强到把我们给干掉的地步,我想这也是不必担心的。人工智能和自然智能或者是人类智能其实走的路是非常不一样的。人类智能定义实际上不是单一的,它是一个泛化的、比较模糊、非常难以衡量的功能,比如说某一个人会笑,某一个人会哭,谁笑的好,谁哭的好这是很主观的事情。而人工智能所集中的东西是单一的、明确的、可评测的功能,比如说下围棋、下象棋、搜索。人类智能使用的数学模型未知,具有无限潜能;而人工智能使用显性,简化的数学模型,可以获得理论、实际的边界,而人类的潜能,还没有看到它的边界。在两者实现方式上你会发觉也很不一样。我个人观点只要是在有限,透明规则、特定任务下,机器超过人的水平是时间问题,绝对是会超过的,没有什么好担心的,而且是好事,因为它可以帮人类实现很多有价值的功能,成为人类的好助手,降低我们生活的成本,提高我们的效率。
但人工智能是代替人吗?对我个人来说,这是天方夜谭。人在很多方面,实际上跟机器是很不一样的。我们的工程能力连造一个细菌用生物学角度讲都没法造出来,更不要说去实现人的思维和头脑,所以说从技术的可能性上来讲,还有很大的距离。而且人的头脑有很多独特的功能,比如创造性思维、感情、常识、美感,这都是人工智能途径或者方法无法企及的。特别是当音乐进行某一个时刻,你可以看到,它能够直接去接触到人的心理,这个我们人工智能不知道怎么去用数学公式定义这么一个程度。大家在听机器人弹琴能不能被弹哭,我自己还有待观察,但这个曲子,这个表演,绝对可以达到这么一个境界,我们历史上的伟人孔子、拿破仑、贝多芬、梅纽因、托尔斯泰,巴兰钦、普列赛斯卡娅,爱因斯坦,你觉着他们会被机器代替吗?