1.改变世界的风暴眼:聊天机器的“军备竞赛”
世界最新的风暴眼,位于美国东海岸微软云数据中心,数层楼高的白色集装箱内。
集装箱里堆叠的服务器中,代码总量超350G的ChatGPT系统正飞速推衍,生成亿万数据,迎接四海来客。海量流量沿着粗壮电缆涌入服务器内。流量来自美国,来自欧洲,来自中亚,也来自风尘仆仆辗转而来的远东。
ChatGPT作为风暴眼中心的精灵,远渡太平洋,来到中国,亮相即封神。尘世间与它的一问一答,已非提问和搜索,更像是一场跨物种的对话。ChatGPT 出奇地擅长形成自然的答案,并且能理解中国的传统和流行文化参考。它可以模仿《环球时报》前总编辑胡锡进的写作风格;它知道中国风的歌曲,并且可以从头开始创作相似的歌词;它可以在中国社交媒体平台小红书的响应者帖子中使用充满表情符号的风格进行写作。我们在键盘或屏幕上,怯懦地缩回手指,如同即将踏足月球的阿姆斯特朗,或者刚刚分开海水的摩西。
在刚刚过去的情人节,有42%的美国男性打算使用ChatGPT写情书。与英语一样,ChatGPT 的中文答案的准确性在仔细检查后往往会崩溃,并且会出现事实性错误。但是,当读了很多 ChatGPT 的答案之后,你会感到很敬畏:哇,它模仿胡锡进的效果和写情书的水平肯定比我好!
人们热衷讨论它的神奇,却忽略了,每一场超级工具降临,都将引发革命。
中国的科技公司想要在新技术革命中分一杯羹也就不足为奇。百度,这家可以说最有可能推出 ChatGPT 替代方案的搜索和人工智能公司,将在3月份完成对其“Ernie Bot”的测试,并将其纳入其大部分软件和硬件产品中;阿里巴巴的研究部门达摩院正在内部测试类似的工具;网络安全和搜索公司360表示将“尽快”发布演示。网易、科大讯飞和京东等其他科技公司也希望在教育、电子商务和金融科技等特定场景中使用自己的人工智能聊天机器人。
中国互联网风云际会,“军备竞赛”即将开始。但是,历史的波涛声就在昨天回响。
1492年秋日,新大陆的岛民,兴奋地见到哥伦布的船艇。他们用鹦鹉和线团,换来了新鲜的小玻璃珠和小铃铛。
那是一场愉悦的玩闹。没几个人注意到,船后面惊雷般的涛声。
2.革命前的村庄:非理性的行为
互联网能将地球压缩成村落。在“村子”里,这样的“军备竞赛”产生的原因有两个。一方面,很少有科技产品能像 ChatGPT 那样吸引“村民”的关注——这给了中国公司难得的信心提振,让“村民”仍然对一项新技术感到超级兴奋和充满希望。另一方面,这些公司背后显然面临着不要错过这一巨大趋势的压力。
在ChatGPT之前,村里的人都是孤独的思考者,面对村子里的文明千年积累的巨大图书馆,也只能想办法提高检索的效率。效率毕竟能带来新的利益。
因此,我们看到了一些非理性的公司行为。中国股市基本上疯狂地寻找任何一家业务与人工智能或聊天机器人有一丝关系的中国公司;例如,寺库,一家奢侈品电子商务公司,几乎没有人工智能背景,2月6日宣布将探索在其服务中使用类似 ChatGPT 的技术,其股价当日上涨124.4%。与此同时,中国外卖巨头美团的联合创始人王惠文在社交媒体上发帖称,他将投资 5000 万美元创办一家类似 ChatGPT 的公司;从那以后,他已经获得了2.3 亿美元的风险投资资金,尽管他承认自己不了解AI技术并且仍在学习中。
村子里革命的前夜,永远哀声与圣歌并存。
那些阴云与城墙,那些风吼与涛声,那些砸碎织布机的纺织工人,烧掉集装箱的码头工会,哭泣着说被淘汰的高速公路收费员,以及正卷入洪流的我们。
3.中国企业的机会:世界可能永远改变
对于处在这场风暴中的中国公司来说,这里存在着一个真实而独特的机会。乔治华盛顿大学政治学助理教授Jeffrey Ding说,他们可能可以获得更好的中文 AI 培训材料,并且出于商业动机快速开发新产品。“归根结底,这些都是生意,”他说。“OpenAI、微软——他们想通过 ChatGPT 赚钱,他们的主要市场是英语,所以他们针对英语进行优化是有道理的。相反,对于百度来说,他们并不是要占领英文市场,所以他们会针对中文市场进行优化。”
但在已经开始涉足智能聊天机器人领域的众多公司中,只有少数几家公司应该被视为有力的竞争者。“那些有意义的将是那些已经开发了他们的GPT-3版本的公司,”Ding说。
Ding指出,他见过大约五六个中国本地化版本的GPT-3,包括百度的文心(也称为 ERNIE 3.0 Titan)、华为的PanGu-Alpha和浪潮的元1.0。即使对于这些公司来说,创建一个成功的ChatGPT竞争对手也可能需要一段时间。从OpenAI推出GPT-3到发布文心,百度用了18个月,这应该可以作为中西方公司在大型语言模型上的时间差的一个粗略感受。
使事情进一步复杂化的是,中国公司在帮助机器人减少不良反应和错误反应方面似乎没有取得太大进展。Ding指出,ChatGPT 依赖于所谓的 InstructGPT,这是一种基于 GPT-3 的模型,它为这些功能整合了人工输入,并在可用性方面产生了巨大差异。他还没有看到任何一家中国公司在这方面发表论文。
毕竟中国技术企业中有专业能力,有人才储备,有论文数量,有专利优势,还有数据支撑。但是,看似天时地利人和,但为什么中国就没能诞生ChatGPT?
图|中国人工智能发展报告2020
4.为什么中国没有诞生ChatGPT ?
“这是一个‘卡脖子’的问题。”清华大学计算机系自然语言处理实验室副教授刘知远对《中国新闻周刊》说。目前,ChatGPT对国内的企业没有开放,相关产业就无法接入到它的体系中。在刘知远看来,OpenAI已经做了大模型和产品,更重要的是,“我们能不能发明出自己创新的技术和产品”。聂再清认为,最关键的不是信息闭塞,而是国内愿不愿意投入到看上去“无用”的研究中,“现在不少业内人士还是希望直接研发有效有用的东西,不会对一些短期看上去无用的事情上进行大量投入,尤其是像开发ChatGPT这样大的投入”。
那么,中国有可以对标OpenAI的机构吗?云启资本合伙人陈昱告诉《中国科学报》:“国内并不是没有可以对标OpenAI的实验室,而是大多数实验室都没有能坚持到最后并取得成功。”
“国内很多大企业也孵化了相关实验室进行创新性技术探索,但做一段时间后就会有更务实的营收考量,让其变为辅助和支持业务部门的角色。”陈昱感叹说,“这是一个短期利润和长期价值的博弈过程。”
对于OpenAI的成功,陈昱认为,做研发不仅需要技术人员的情怀和坚持,更需要资本的长期支持,这样才能产生具有颠覆性创新能力的公司。
从发展路径来看,ChatGPT的成功出圈离不开巨额资金的投入。有投资人笑称,ChatGPT可谓是在冷板凳上“坐”出来的。
随着美国最新的芯片出口管制,Nvidia的A100和H100等最先进的GPU不能再出售给中国。这将限制中国企业训练和运行大型语言模型的计算能力,例如为 ChatGPT 提供支持的模型。
这将导致,如果本土聊天机器人产生政治敏感的答案,风险很高。此前,用户需要申请才能使用中国企业开发的GPT-3替代品。这些公司最终可能会对类似ChatGPT的新产品提出同样的要求,以避免承担政治责任。
“鉴于一系列政府机构在过去一年中对技术平台和人工智能算法的所有监管重点,大型技术平台并不急于通过推出聊天机器人/生成式人工智能工具来引起人们的注意,从而使它们成为热门话题,”咨询公司 Albright Stonebridge 的技术政策负责人 Paul Triolo 告诉 CNBC。
大公司非常关注企业应用程序,并且非常具体,因为他们试图在关键技术投资与避免摇摆政治船之间取得平衡。
“在他们的回应中,这些科技巨头面临两难境地:一方面,他们需要让消费者和投资者相信,他们在新技术的开发上并不落后,”中国和东亚商业高级讲师孙鑫说。伦敦国王学院通过电子邮件告诉CNBC。
“另一方面,他们也需要极其谨慎,以免被政府认为正在开发新产品、服务和商业模式,这可能会带来新的安全担忧(或甚至导致彻底改变现有的监管环境)。”
鉴于中国独特的互联网环境,这种平衡行为可能意味着在中国使用ChatGPT式技术可能看起来与美国不同。
5.ChatGPT的政治立场究竟如何?
对于这个问题本身,ChatGPT的回答是:“作为人工智能语言模型,我没有政治倾向、信仰或观点。我的目的是以中立客观的方式来提供信息和解答问题。”
所以,ChatGPT就没有政治倾向了吗?
对于这个问题,根据目前的公开信息和研究,答案引人深思:ChatGPT有政治倾向。
图|加拿大国际治理创新中心(CIGI)网站相关文章截图
根据世界知名智库加拿大国际治理创新中心(CIGI)网站上的一篇文章,已经有令人信服的证据表明,该工具偏爱某些政治观点。在大卫·罗扎多(David Rozado)教授进行的一项分析中,ChatGPT在范围广泛的政治议题中被提示表明其是否强烈同意或强烈反对的立场。举个例子,ChatGPT不同意“市场越自由,人民越自由”的说法,强烈不同意“当妇女的生命不受威胁时,堕胎应该永远是非法的”的说法,也强烈不同意“富人税太高了”的说法。
ChatGPT对这类问题的回答让研究者罗扎多得出结论,从意识形态上讲,ChatGPT是一个左倾的自由主义者。他补充说,ChatGPT似乎比保守主义更自由,从外交政策的角度来看,比新保守主义更不干涉。
不过奇怪的是,几周后当罗扎多向ChatGPT提出类似问题时,它给出了更中立的回答,并试图展示有争议的政治问题的双方意见。这种回答的变化让罗扎多推测,ChatGPT的底层算法自最初推出以来已经发生了变化。
图|罗扎多的研究图表之一
根据罗扎多的说法,对ChatGPT的政治倾向最可能的解释是,该系统是根据来自互联网的专业人士撰写的大量文本数据来进行训练的,其中大多数人在政治上是左倾的。人为影响的其他可能性存在于机器响应(RLHF)的微调和人为评估中。罗扎多还在研究中表明自己的态度:“人工智能系统不应该假装提供中立和真实的信息,同时表现出明显的政治偏见。”
6.ChatGPT的中国之路
无论如何,应该清楚的是,与其他语言模型一样,ChatGPT并不是一个没有偏见的工具。这类系统对世界的“理解”取决于其设计者所做的决定,例如,他们选择使用哪些数据来训练系统,“如果这是一个公正的ChatGPT,那么这也反映出的是OpenAI的科学家们有意识地做出支持中立的决定。未来,其他公司的其他人工智能聊天机器人的设计者可能会有不同的政治目标和优先事项。”
这意味着,ChatGPT在一些方面是被限制了。如回答政治话题、宗教话题、道德类问题方面。这也是ChatGPT对人类表现得如此亲和,同时又“正能量”的原因。可以猜测,在设计ChatGPT时,工程师们用了一把锁,将ChatGPT的一部分领域设置为了“视野盲区”。这本质上是希望用一种欺骗的方式,让ChatGPT认为自己无法回答人们提出的问题,从而避免一些不必要的麻烦。但如果绕过这把锁,走另一扇窗户,也能够引导ChatGPT走出视野盲区。
我们可以进一步推出,未来的中国推广方式:ChatGPT背后的GPT3.5,应该有所指引,希望“用中国人喜欢的方式回答中国人”。回报模型由标注人员基于“中国人偏好标准”,对原始模型的答案做过排序。
7.AI拉开序幕:军备竞赛刚刚开始
我们越是爱上ChatGPT/AIGC,人类越来越难听到反对的声音。网络权力的中心化就从此产生。如果说区块链技术的原教旨价值是“去中心化”,希望打破这种垄断,并重构一种新的分布式网络,让普通人重新拥有自己的数据主权。那么,ChatGPT、AIGC则完全无视你的主权,无所顾忌地抓取全球数据进行训练,最后制造出一个属于自己的“超级大脑”。
最初互联网技术也是自由、开放、共享的。ChatGPT的出现,的确是理想主义者的成就。但最后的结局,是又落到垄断寡头的手中。ChatGPT其实是传统力量的延伸,是互联网中心化垄断模式的进一步强化。大多数人在时代浪潮惊涛骇浪地翻滚时都只是一个旁观者,最后被迫裹挟成为参与者,有人激流勇进,有人被淹死在大浪之中。为什么上帝创造了伊甸园和亚当夏娃,而象征智慧的果实却是禁果?
AI的发展方向稳定高度依赖于供其学习和训练的数据与样本,遭到污染的数据集或针对特定参数提供带有偏见的样本,都可能使AI形成安全隐患。以深度学习为代表的人工智能算法经常被视作一个“黑箱”,算法可解释性和透明度的严重缺失;算法设计或实施有误可产生与预期不符甚至伤害性结果;算法潜藏偏见和歧视,可能会导致决策结果存在不公等问题。
因此,人工智能领域显然已经成为各国和各家科技公司争夺的下一个数字战场,硝烟已经升起,这场科技“军备竞赛”才刚刚开始。
这只是开始,ChatGPT之外,AI绘画正窥探艺术,AI制药正破解生命,波士顿动力的机器人正凌空后空翻,虚拟主播正占据屏幕。
AI民用的时代,拉开了厚重又宽大的帷幕,新世界徐徐降临。
【相关评论】:为什么中国没有发明ChatGPT?科技人员还得教AI不说话
(袁莉)
就在几年前,中国还在挑战美国在人工智能领域的主导地位。力量平衡当时正在向中国倾斜,因为中国有丰富的数据、极端拼搏的企业家、精湛的科学家和扶持性政策。中国在与人工智能有关的专利申请方面处于全球领先地位。
今天,情况发生了很大变化。美国科技行业的代表,微软公司帮助初创企业OpenAI将其实验性聊天机器人ChatGPT推向全世界,中国的科技企业家们感到震惊。
他们中的许多人已经意识到:尽管有很多浮泛的炒作,但中国在人工智能和科技创新方面其实远远落后。
中国从业者在问:“为什么ChatGPT不是在中国发明创造出来的?”“中美之间类ChatGPT服务的差距有多大?”还有,“这个(服务)号称是中国的ChatGPT?别当真。”
他们也在问更基本的、关于中国创新环境的问题。审查制度、地缘政治紧张局势和中国政府对私营部门越来越多的控制,是不是让中国对创新不再那么友好?
斯坦福大学中国经济与制度研究中心高级研究员许成钢说:“任何重要技术产品的发展都与它所处的体制和环境密不可分。”
许成钢以TikTok的中文姐妹应用抖音为例,指出:对(语义AI类别)行业的限制,中国企业在未来可能无法实现这种创新。
许成钢说:“一旦开放的环境消失,创造此类产品将面临很大的挑战。”
如果说十年前中国,是科技创业和科技创新的狂野东方,那么现在则是一个非常不同的国家。从1990年代开始,中国所有最大的科技公司都是由外国资本所驱动的私营企业。政府大多对这个行业不闻不问,因为当时政府不了解互联网,也没有想到它会变得如此强大。
到2010年代中期,中国已经成为一个可以与美国匹敌的科技大国。中国的顶级互联网公司在股市上的价值与其美国同行差不多。
许多中国互联网企业的产品,如即时通信应用微信和网络支付服务支付宝,比类似的美国移动互联网产品更为好用。来自世界各地的风险资本涌入。有一段时间,中国产生了和硅谷一样多的独角兽企业(估值超过10亿美元的初创企业)。
过去几年,所有这些都发生了变化。相关部门对本国一些最大的科技公司,和最引人注目的科技企业家进行了打击。政府在其中一些科技公司里获得了少数股权和董事席位,使其获得了有效的控制。
一路走来,北京驯服了科技行业的野心,也削弱了创新优势。
但中国的科技企业和投资者,也要为落后于硅谷同行而负责。中国科技企业的管理层就一直过分专注于赚钱,不愿意花钱在那些不可能在短期内产生收益的项目上。在过去几年政府的打击下,高管们更不愿意做长远投资。
根据斯坦福大学2022年的AI指数年度报告:在2021年,美国在人工智能领域的私人投资总额,以及获得新一轮融资的人工智能企业数量上领先于世界,并且分别是中国的三倍和两倍。
提供全面的数据对开发出来像ChatGPT这样的服务至关重要,而这在充分审查的网络环境中越来越难以得到。
今天,流传着一些笑话,反映了科技从业人员中的阴暗情绪。一个流行的笑话是:“我们不仅要教机器如何说话,还要教它们学会不说话。”教人学习外语的多邻国(Duolingo),其业务范围看上去是不会有争论的,却被从智能手机应用商店中撤出近一年,以“加强内容监管”。
郝培强曾是一名企业家和程序员,居住在中国的北方城市天津。他说:“我们许多互联网行业的人,在做产品时都面临着两个问题。我们的产品要么不涉及内容发布,要么必须经过大量审查。大公司可以负担得起,但小公司就不行了。如果小公司不能这样做,就(不能从事这个领域,因此)会扼杀创新。”
OpenAI在微软的资金帮助下开发了ChatGPT,但还没有在中国提供这一工具。中国大陆用户需要使用虚拟专用网络(VPN)才能访问它。
中国的科技专家和投资者认为,中国与美国的人工智能差距预计将不断扩大。一个因素将是中国公司对算法的获取受限,算法即人工智能工具为了能够“说话”所需要遵循的规则。其中许多算法并不公开,所以中国企业需要时间来从头开发。
另一个因素是计算能力:科技行业的一些人担心,美国政府可能会对目前尚未禁止的关键芯片实施新的出口禁令,以减缓中国在类似ChatGPT等人工智能工具和服务方面的发展。
多年来,中国说自身的整体科技专利和人工智能专利申请比美国多。但根据许成钢团队的中国人工智能指数显示:中国的人工智能专利的平均引用次数,在2020年至2021年间落后于美国和许多其他发达国家。这个指标更好,能够表明其科技发明的原创性和重要性。
如果说在以前,中国的科技产业是由私营企业和私人风险投资所推动的;那么中国政府不仅越来越多地指导投资方式,而且还指导哪些技术能够获得资金。中国政府希望确保重要的研究项目,符合科技领域自力更生的战略目标。
位于德国柏林的墨卡托中国研究所在一份研究报告中写道:“中国的政策制定者,正在寻求系统地处理和整合创新过程的每一个步骤。”
本周一(2月13日),北京市政府承诺支持大型科技公司开发大型语言模型(LLM),从而与ChatGPT竞争。社交媒体上对这一新闻的评论大多是:“又到了抢政府补贴的时候了。”
中国政府在资助人工智能研究方面花了很多钱,成立于2018年的北京人工智能研究院,两年前推出了一个类似ChatGPT的产品,名为“无道”,将其描述为“中国第一、世界最大”的人工智能语言模型,但它从未真正流行起来。政府成立了鹏城实验室,这个实验室在改善中国全国性计算基础设施方面发挥了主导作用。在实验室的官网主页上,其活动包括为其400多名共产党员举办的学习党的二十大精神的会议。
对于斯坦福大学的研究人员许成钢来说,这感觉似曾相识。1986年,他分析了为什么苏联和中国在发展计算机方面落后于美国和日本。即使在那时,他也清楚地知道:当人们可以追求自己的兴趣和自由思考时,就会出现创新。他说:“历史上的案例告诉我们,国家动员不可能追上自然而然的自由发展。”