导读:李彦宏表示,在中文上,文心大模型4.0已经超过了GPT-4。
3月9日,百度创始人、董事长兼首席执行官李彦宏在央视《对话》•开年说的访谈中指出,基本上说,以后其实不会存在“程序员”这种职业了,因为只要会说话,人人都会具备程序员的能力。“未来的编程语言只会剩下两种,一种叫做英文,一种叫做中文。”
李彦宏:在中文上文心大模型4.0已经超过了GPT-4
李彦宏表示,在中文上,文心大模型4.0已经超过了GPT-4。他以写诗为例,称像文心大模型等大模型都能写,但GPT不行。“比如写一首诗,很多大模型都能写,但如果我要求写一首《沁园春》词牌的词,那GPT就完全搞蒙了,它不知道第一句话是4个字还是5个字。”过去一年,文心一言用户数量已突破1亿,文心大模型已升级至4.0版本,经过重构的百度文库等AI原生应用也实现了各类数据指标的提升。
自文心一言发布后,网上存在一些负面评价。对此,李彦宏表示,对于ChatGPT和文心一言有着天壤之别的言论并不生气,他希望在一年内能够改变这些人的想法。他称对于文心一言是非常有信心的,能够拿到专业版使用权的人可以和ChatGPT4.0比较一下。
对于人工智能发展速度,李彦宏表示:“我觉得人工智能发展比我想象中更慢。人工智能已经被提出快70年了,可能每过10年左右,就有一群人说,我们终于要实现通用人工智能了。但其实情况比想象中要复杂。”
针对很多公司纷纷推出大模型,引发“百模大战”,他表示:没有觉得有那么多人应该去做同样的事情,对社会资源是一个很大的浪费,大家都在重复劳动。他还表示:一直在劝大家不要去卷(大模型),去卷应用,只有应用是真正直接创造价值的。
此外,李彦宏认为:“未来的机器人不应该长得像人,应该长得像车。”“它听懂得人话,又能自己开,这是一个全新的理念。”
文心一言用户规模突破1亿
北京时间2月28日,百度发布2023年第四季度及全年财报。财报显示,百度2023年总营收达1345.98亿元,同比增长9%;归属百度的净利润(non-GAAP)287亿元,同比增长39%。其中第四季度营收349.51亿元,同比增长6%;归属百度的净利润(non-GAAP)77.55亿元,同比上涨44%。
过去一年,百度核心收入1034.65亿元,同比增长8%;归属百度核心的净利润274亿元,同比增长38%。其中包括网络营销营收751亿元,同比增长8%;非营销营收为284亿元,同比增长9%。
在研发方面,百度去年的研发支出为242亿元,较2022年增长4%。其中第四季度百度研发支出为63亿元,同比增长11%,这也反映出百度在文心一言研发投入和服务器折旧开支及服务器托管费用的增加。
过去一年大模型成为科技领域的关键词,也引发了一场轰轰烈烈的“百模大战”。作为国内大模型领域的较早入局者,今日百度披露了AI原生应用文心一言的相关数据。截至12月底,文心一言用户规模突破1亿,累计完成了37亿字的文本创作,输出了3亿行代码,帮助用户处理了累计4亿字的专业合同,制定了500万次的旅行计划。
以下为《对话》节目实录
(根据访谈内容有增减)
旁白:老板这是您的任务卡。
李彦宏:2024年您最想做的一件事是什么?伟鸿,我在百度等你!
陈伟鸿:Robin!又见面了!
李彦宏:伟鸿,欢迎欢迎!刚才坐我们这个车来的啊?
陈伟鸿:一个是坐你们这个车来的,一个是开你们这个车来的。
李彦宏:还体验了一下。
陈伟鸿:我体验了一下,真棒真棒!
李彦宏:我们这个理念跟所有车还都是不一样的,我们把它叫做汽车机器人。未来的机器人不应该长得像人,应该长得像车。
陈伟鸿:它该是什么样,就是什么样是吧?
李彦宏:对,它有它的功能,但是又听得懂人话,又能够自己开。这是一个全新的理念。
陈伟鸿:我刚才在车上,几乎在自动驾驶阶段,是完全放手的,我给它发号施令就行了。
李彦宏:一般简单的路况它都能够处理。这个技术还在迅速演进,它会越来越好。
陈伟鸿:你不想亲自下场造车吗?
李彦宏:那个门槛稍微有点高,比较麻烦。
陈伟鸿:但很多人现在都自己下场了。
李彦宏:对!但其实也好多是代工的,代工到产量足够高的时候,慢慢再自己去建厂。
陈伟鸿:这本杂志我觉得特别有意义,《时代》杂志封面人物。这是哪一年?我看看,2018年。
李彦宏:对,它起的名字也不错,《创新者》。国外对咱们中国,给定位成创新,我觉得还是很正面的。
陈伟鸿:没错。一下子抓住了你的精髓,从创业初期,把百度一路带到这样一个高度。
李彦宏:我们确实对技术很重视,这么多年研发费用占到收入的比重一直是20%多,全中国(平均)大概是百分之二点几,二点几已经算比较高了。但是对于百度来说,我们是20%以上。
陈伟鸿:在这方面不遗余力。所以走进百度大厦,我知道它是2009年建的,每一年它的物理结构可能没有太大的改变,但是在这当中的各种创新、技术,无处不在。
李彦宏:没错,这个展厅其实是不停在变的,每隔一段时间都有新东西。
陈伟鸿:人工智能这些年,发展速度超出了我们的想象。我不知道对于你来说,它的速度是在想象当中吗?
李彦宏:我的感觉是反过来,比我想象的还要更慢一点。
陈伟鸿:真的吗?
李彦宏:人工智能这个词提出来已经快70年时间了。可能每过10年左右,就有一波人很兴奋说,我们终于要实现通用人工智能了。后来发现其实不是那么回事,情况比想象的要复杂。
陈伟鸿:你这么说,我想到一个有趣的细节。很多年前,在社交媒体上好像有人或者您自己,晒过一个当年在北大学人工智能时候的笔记。
李彦宏:是我。那个时候我是选修课,当时是本科生,其实不应该去学人工智能课,但是我就很喜欢,也觉得人工智能代表未来。为什么我喜欢呢?我觉得,人怎么想、怎么做,其实是很自然的事情。我怎么能够让机器也具备比较自然的能力?
陈伟鸿:以前,我们觉得这简直是完全做不到的。
李彦宏:那个时候,(人工智能)完全靠规则,就是很初级。但是我仍然觉得,这是我很喜欢的一个领域。
陈伟鸿:我们看到,百度相比其他公司更早All in 人工智能领域。你觉得这算是一种预见性、先知性,还是说跟当时课堂学到的东西有关系呢?哪一种是背后真正的力量?
李彦宏:跟我个人爱好,或者说背景,肯定有很高相关度。但最根本的推动力其实还是应用。百度能够在十几年前,就这么坚决地投入人工智能,就是因为搜索本身解决的问题,跟人工智能解决的问题是一模一样的。
陈伟鸿:之前人们在寻求问题答案的时候,“众里寻它”可能只有百度,但是现在我们有了文心一言。在我们看来,好像是个很丝滑的过渡。但在特别注重技术和创新的您的眼中,就是一种发展和跃升。它对于人工智能的研究来说,意味着什么?
李彦宏:(搜索和文心一言)还是有非常本质的不一样。最早的时候,搜索引擎这个技术,实际上是一个统计,统计一下词频。比如说搜索“陈伟鸿”,看哪一个网页里头这个词出现次数多,就把这个网页排在前面。后来我发明“超链分析”之后,看哪个链接里这个关键词出现次数多,它都链接到哪些网站上,被链接到的网站就是最相关的。再往后,用人工智能之后,就是用机器学习来学,用户搜了这个词、点了那个结果,到底是什么意思。
陈伟鸿:它们之间的内在联系在哪?
李彦宏:被点击次数多,说明跟这个词更相关。这样一步一步,到今天出现文心一言,出现大模型的时候,它又发生了一个本质变化。大模型实际上是事先学习了全网所有的知识,把它压缩成一个模型,或者是一大堆参数。当用户来问问题的时候,我直接根据这些参数,就可以猜出这个问题的答案是什么。它背后的工作原理,已经非常不一样了。
陈伟鸿:对于大多数的公众来说,我们是从2023年才开始接触人工智能大模型这几个字。百度也是国内互联网公司当中,率先推出大模型的。文心一言和ChatGPT,谁使用起来更顺手、更舒服一点?
李彦宏:如果(文心大模型)4.0和(GPT)4.0去对比,在中文上我们其实已经明显超过了。举个例子,比如写首藏头诗之类的,现在很多大模型都能写。但是如果要写首词,一个《沁园春》这个词牌的词,那ChatGPT4.0完全搞蒙了。它不知道第一句话应该是4个字还是5个字。
陈伟鸿:在我们中文世界的博大精深面前,我们的文心一言还是能够满足我们需求的。
李彦宏:文心一言真的懂,什么叫《清平乐》,什么叫《青玉案》,什么叫《沁园春》。这个跟国外这些先进模型比,我们已经超过了。当然客观地讲,我们用的英文训练数据没有它多,所以硬要比英文效果的话,我们确实跟它有一点差距。
陈伟鸿:我记得你说过,百度“熬得过万丈孤独,藏得下星辰大海”。我有两个问题,一个是究竟我们藏下的“星辰大海”是什么?第二个,当我们有了大模型,科技新生力量出现的时候,我们是不是已经熬过这些孤独,已经修成正果了?
李彦宏:首先说“星辰大海”。“用科技让复杂的世界更简单”,这是百度的使命。我们所说的“星辰大海”,实际上就是指这个。我们有技术信仰,觉得技术能够改变这个世界,能够让这个复杂的世界变得更简单。每每想到这样一个理想,想到能通过自己努力,对这个世界产生相应改变的时候,就觉得很兴奋,觉得它代表我们心中的“星辰大海”。
陈伟鸿:那对于“熬过万丈孤独”这件事儿,您目前的感受和评价是什么?
李彦宏:我觉得是越来越接近熬得过吧。其实应该说还没有完全走出来,现在仅仅看到了一点曙光,天还处在蒙蒙亮这个阶段。但是因为看到曙光,就会很兴奋。你已经走过了最黑暗的阶段,看到各种各样的可能性都扑面而来,这个时候心情还是非常兴奋的。
陈伟鸿:百度在国内互联网公司当中率先推出大模型的,但当你推出之后,环顾四周发现突然有了“百模大战”,会不会影响您的节奏?
李彦宏:确实不应该有那么多人去做同样的事。
陈伟鸿:没有想到,突然间会有“百模大战”这个事出现。
李彦宏:我觉得是社会资源一个很大的浪费,大家都在重复劳动,在做同样的事情。
陈伟鸿:你会劝退一些人吗?
李彦宏:我一直在劝,我说大家不要去卷模型了,卷应用吧,只有应用真正直接创造价值。
陈伟鸿:我之前看到过比尔·盖茨和奥尔特曼之间的一个访谈。他当时问了奥尔特曼一个问题,说你能预测一下,未来两年大模型会给人类的生活或者是生产带来什么改变?我今天也借用一下他的问题,来问一问您,您怎么看这个事?
李彦宏:我认为,大模型对于人类生产生活的改变会是非常根本性的。互联网改变了我们的很多生活,但是这一波人工智能的改变,会更加的彻底、更加的深刻。
这个事的意义在哪呢?基本上,以后其实不会存在程序员这种职业了,所有人只要会说话,甚至连写字可能都不用,你就具备今天程序员所具备的能力,所以这个意义还是很大的。未来的编程语言只会剩下两种:一种叫英文,一种叫中文,这也是目前世界上人工智能技术最领先的两个语言。我觉得还是非常令人兴奋的。
陈伟鸿:现在我们在提新质生产力的时候,您觉得像这样一种革命性的力量,是不是也可以理解为新质生产力的重要组成?
李彦宏:对,这是绝对的新质生产力,甚至在我看来,是新质生产力当中最核心的部分。所谓新质生产力,我理解就是创新驱动出来的生产力、创新驱动出来的增长。那么创新空间最大的就是人工智能技术。
萝卜快跑
萝卜快跑是全球最大的无人驾驶运营商,已为用户累计提供超500万次乘车服务。目前,萝卜快跑全无人自动驾驶车队已驶入北京、深圳、武汉、重庆、上海五座城市。
自2022年8月在武汉开启全无人自动驾驶出行服务至今,萝卜快跑在武汉的车辆数、运营面积、覆盖人口均实现指数级增长。近期,萝卜快跑全无人自动驾驶车辆首次跨过武汉两座长江大桥,标志着全国首个全无人自动驾驶出行新场景诞生。
李彦宏:说到智能交通,其中最大的应用就是自动驾驶、或者说是无人驾驶。
陈伟鸿:这么有趣的名字,它叫萝卜快跑。
李彦宏:萝卜快跑,实际上萝卜是英文的robot。
陈伟鸿:不是Robin,是robot?
李彦宏:对的。这是武汉市的地图,是目前全世界范围内最大规模的商业化无人驾驶运营区。现在覆盖的人口已经是300万,像美国旧金山,全城不到100万人,覆盖的人口比我们小很多。武汉大概有500辆百度萝卜快跑的车,当地市民已经习以为常了,他们经常打这个车出行,从早晨6点到凌晨2点都可以打到。这个图显示的就是每一辆车现在在什么位置,每天都有几千单、上万单在跑。
陈伟鸿:无论是在学校门口、还是地铁口、工业园区门口,大家都可以通过无人驾驶来感受现代生活的便捷。
李彦宏:很快,武汉机场到这些地方都可以开通。
陈伟鸿:什么时候北京也有这样一张图,我们也能用起来了。
李彦宏:北京在亦庄,但是规模没有这个大。
陈伟鸿:最近这些年,大环境、小环境都发生了很多变化。
李彦宏:很大的变化。
陈伟鸿:尤其你在的行业当中,更是日新月异,可能都不足以来形容它的快速了。其实这种快会让人有一些焦虑,我不知道你会不会焦虑?
李彦宏:说实话也会,有时候晚上睡不着觉,就会思考一些白天觉得无解的问题,甚至有时候做梦突然就想到了什么。
陈伟鸿:什么事让你有这样的改变?
李彦宏:各种各样。比如大模型这么火,它到底能产生多少实际的价值,过去一年我最主要就在思考这个问题,ChatGPT大火的时候,别人问我怎么看,我当时就说,现在这个火还有点早,真正什么时候我们能够做出上亿用户都在使用的应用的时候,才是它真正的价值得到了体现。所以过去一年,如果说焦虑,主要就大模型已经能力放在那了,上面的应用是啥。
陈伟鸿:作为公众公司,常常会听到一些别人对你的评价,或者是议论,有人觉得你做的不像你自己说的那样。或者说你做的不像你说得那么好。其实这类的东西往往会给人心理上带来一些不舒服的感觉,我不知道就是这些声音您会怎么看待它?
李彦宏:首先我还是看了不少这些方面的。
陈伟鸿:你会去看?
李彦宏:我会去看。
陈伟鸿:我们通常都会说看这些东西心里有堵,你干吗要去看它呀?
李彦宏:从正面角度理解它的话,我们把它叫做反馈,其实大模型也需要人类反馈,人在用的时候,它到底是喜欢还是不喜欢,一旦你给反馈,就有提升的机会,我看网上各种各样对百度的评论,对我们产品的评论,也都是把它当做一种反馈,有时候说的是对的,我当然很高兴,我去改进。有时候说得不对,我也觉得,好吧,我一定要证明,你是说错了。
陈伟鸿:其实心里憋了一口气,一定让你看到一个更好的百度。
李彦宏:像去年刚刚发布文心一言的时候,关注度也很高,我看到网上确实有很多非常非常负面的评价。我记得有一个漫画,一辆特斯拉的车,还有一辆好像小三轮车那个样子,这就是ChatGPT,这就是百度的文心一言,它们之间的差距天壤之别。看了之后,说实话我也不生气,如果现在这些人是这么想的话,我希望一年之内让他改变这个想法。今天任何一个能够拿到文心一言专业版使用权的人,可以去比较一下,我们跟GPT4相比较怎么样?我是非常有信心的。所以我总是觉得,我每天都在走一个新的路,每天都在感受一个过去没有感受过的东西。
陈伟鸿:太阳每天都是新的。我们今天的黄昏落日也是新的。
陈伟鸿:每个企业家需要打交道的人都很多,我们今天都写在了这个小卡片上,您最想选其中的哪一个角色,来跟他做交流?
李彦宏:我最想说的对象还是年轻人,因为人工智能大潮的到来,对未来社会会有非常深刻的改变。年轻人有可能迷茫。我还是看到很多追求上进的人,用我的词叫做driven(上进)。他们觉得所有这些挑战,对他来说都是一个进步的机会。尤其在人工智能领域,对于年轻人来说,他们有更少的肌肉记忆,他可以更加撇开过去各种各样思想上的束缚,做一些前人没有做过的事情,所以还是希望大于挑战,对于今天这一代年轻人来说仍然是这个样子。