本文将结合大语言模型显露出来的薄弱之处,结合大语言模型未来发展的插件-生态模式(连横)和大语言模型在垂直领域落地的行业AI能力中心模式(合纵)两大趋势,以及这两种趋势背后更深远的发展趋势和格局,分享笔者的一些初步的思考。本文90%以上的文字均由某大语言模型在笔者的授意下自动生成。
一、不足
利用深度学习技术和海量数据进行训练,大语言模型可以实现自然语言处理和文本生成等多项任务,并且在不同领域展现了卓越的性能。然而,大语言模型也存在一些不足,本文将从知识的时效性、复杂推理计算和知识处理能力、对垂直领域应用的支持三个方面进行论述。
首先,大语言模型的知识时效性不足是其面临的一个主要挑战。大语言模型依赖于海量数据进行训练,但是这些数据的时效性不可避免地会受到影响,使得模型在处理最新信息时表现不佳。例如,新闻报道和科技进展等领域的知识更新速度非常快,因此大语言模型可能无法及时了解和处理最新的信息。
其次,大语言模型在复杂推理计算和知识处理能力方面也存在不足。尽管大语言模型可以通过海量数据进行训练,但是它们的推理计算和知识处理能力相对较弱。模型通常需要依赖于先验知识来进行推理和处理,而这些知识可能存在不确定性和模糊性,难以满足实际应用中的要求。此外,大语言模型在理解上下文和抽象概念等方面也存在一定的局限性,需要进一步加强其知识处理能力。
最后,大语言模型对垂直领域应用的支持不足也是其面临的一个挑战。大语言模型在处理通用领域的任务时表现优异,但是在垂直领域应用中可能存在一些问题。例如,在医学和法律等领域,需要专业知识和领域专业性语言的支持,而大语言模型可能无法满足这些要求。因此,需要通过对领域特定数据进行训练和优化,以提高大语言模型在垂直领域应用中的性能。或许,垂直领域还有专业知识之外的更深层次的顾虑,这些我们会在后文专门论述。
总之,尽管大语言模型在自然语言处理和文本生成等方面表现出色,但其在知识的时效性、复杂推理计算和知识处理能力、对垂直领域应用的支持等方面存在一些挑战和不足。未来的研究需要进一步探索和解决这些问题,以实现大语言模型对全社会更加广泛的赋能。
二、连横
如上所述,随着应用场景的多样化和数据量的增加,大语言模型在知识能力方面面临着一定的挑战。由于模型内在机制的局限,仅靠向大模型投喂更多的语料,未必能够解决这些问题。一种常见的方法是通过外挂知识模块来提升大语言模型的知识处理能力。
知识模块的外挂是指在大语言模型的基础上,引入额外的知识模块来帮助模型进行推理和处理。这种方法能够有效地提升大语言模型的知识处理能力,从而满足更加复杂的任务需求。其中,插件是一种常见的知识模块外挂方式。插件本质上是大模型能力的延伸,有利于围绕大模型打造AI生态,对于提高模型的应用价值具有重要作用。
通过插件的方式,可以向大语言模型中添加不同类型的知识模块,包括常识知识、领域知识、事件知识等。这些知识模块可以通过人工标注或自动化方法生成,并与大语言模型进行适配和集成。通过这种方式,大语言模型可以利用这些知识模块来进行推理和处理,从而提升其在复杂任务中的性能表现。
然而,插件部署方式的集中化存在一些挑战。首先,由于算力资源方面的技术原因,以及流量集中方面的商业原因,导致相当一部分部分应用方可能无法接受集中化部署,从而被排除在大模型生态之外。其次,由于插件部署方式的集中化,不可避免地会使应用方对其数据安全和客户流量被分流等方面产生一定的顾虑,这也使得一些应用方不愿意将重要的数据和业务流量放在外部平台上。
总之,插件确实是一种有效的知识模块外挂方式,可以帮助大语言模型提升知识处理能力,从而满足更加广泛的需求和用户对大语言模型更高的预期。但是,从这种“连横”模式得益最多的,还是大模型供应者自身。算力和流量仍然在大模型供应商那里,商业格局没有发生本质变化。与这个商业格局不相融合的诉求,很难通过插件化的方式来得到满足。
为了解决这些问题,当然可以去加强对插件部署方式的开放性和灵活性。大模型供应方可以通过将插件部署方式转变为分布式和去中心化的方式,以更好地满足不同应用方的需求。同时,可以加强对数据安全和隐私保护的措施,以提高应用方的信任度和参与度。但是,这在一定程度上是大模型供应方对自身商业模式的自我革命。成效如何,不得而知。
三、合纵
如前所述,越来越多的垂直领域应用也开始将大语言模型引入到自己的业务中来。然而,由于垂直应用领域的特殊性,对接大语言模型也面临着一些挑战。为了克服这些挑战,垂直领域不会满足于由大模型供应方主导的“连横”模式。用“合纵”的模式是非常必要的。建立一个个“共建行业AI能力中心”是就是承接“合纵”诉求的落地举措。
垂直应用领域具有很强的行业特性和敏感性,因此,“行业AI能力中心”的牵头机构必须具有广泛的行业联系和很强的行业公信力,能够在行业内具有公正和超脱的地位。同时,行业AI能力中心应部署在对行业来说可信的安全区域之内,以技术中立的角色承担具有租户隔离特性的云服务职能,以确保数据的安全和隐私保护。
大语言模型供应方必须对行业AI能力中心有足够的开放度和配合度,以便双方可以深度联合调优,实现模型的精度和效率的提升。大语言模型与垂直领域深度结合之后,客户机构对AI服务的深度依赖将使大语言模型的“断供”成为对业务不可接受的威胁。大语言模型输出的内容是否足够可控和合规,也只有行业才有更加专业的判断能力。只有把大语言模型的预训练初始能力迁移到行业,同时行业自身能够基于预训练模型建立离线的精调能力和合规把控能力,才会对行业的业务连续性和内容适当性有根本的保证。只有当大语言模型的供给足够充分、竞争足够激烈时,大语言模型的供应者才会有动力做出这些关键性的合作举措。你不做,你就出局,自有别人来做。
同时,作为一个面向垂直领域的精调模型,行业AI能力中心所需的算力资源仍然非常巨大,需要发动行业联合筹集算力资源,以确保资源的公平合理分配。在这种“共建行业AI能力中心”的模式下,由行业有公信力的机构牵头,依托行业专用基础设施和熟悉行业数据与场景资源的AI领军者,在有合作意愿和技术实力的大模型供应方的深度配合和指导下,由新技术应用走在行业前列,愿意先行先试的行业用户联合筹集算力资源。这种模式可以充分发挥各方的优势,实现合作共赢的局面。
总之,在垂直应用领域对接大语言模型时,打造一个“共建行业AI能力中心”的模式是非常必要的。这种模式可以充分发挥各方的优势,实现合作共赢的局面。同时,这种“合纵”模式也可以解决数据安全和隐私保护等问题,提高专业领域AI应用的水平,为垂直领域应用的发展提供更加强有力的支撑。
四、 语控万物
随着自然语言处理技术的不断发展,自然语言理解能力日益成熟。对大语言模型的广泛使用,使人们逐渐认识到,大语言模型可以做除了语言生成之外更多有意义的事情。
比如大语言模型可以通过对接数据库、知识图谱、系统命令、大屏幕和驾驶舱操纵、业务流程、工业用及家用设备控制、程序API调用等方式,来实现对各种智能设备和系统的控制和调用。同时,垂直领域的AI应用也可以通过与大语言模型的对接,实现更加便捷和高效的语言交互。这些能力,比起单独的聊天来,经济意义更加重大,所撬动的生产力提升也更加巨大。
人们已经开始将其应用于除语言生成之外的其他能力,形成了一个新的概念:Natural Language to Everything(简称NL2X),即“语控万物”。这个概念表明了自然语言处理技术在不断向着更加广泛的应用方向发展。
在“语控万物”的大语境下,大语言模型和垂直领域AI应用之间必然是多对多的关系。这种多对多的关系,使得大语言模型成为了实现“语控万物”的重要支撑。
在这种情况下,大语言模型的供给会从稀缺走向相对均衡,从而实现更加广泛的应用。同时,居间的“语控万物”也面临着开放标准的建设问题。为了实现各种智能设备和系统之间的协同工作,需要建立一套开放的标准和协议,使得不同厂商的设备和系统能够相互协作和交互。这些开放标准和协议应该包括语音命令的输入和解析方式、指令的格式和语法、数据的传输和格式化方式等方面的内容。只有建立了这样一套标准和协议,才能实现智能设备之间的互通和协作,提高智能化生活的质量和效率。
从技术上看,“事理图谱”是最有条件成为“语控万物”开放标准的方法论基础的。我们期待从事事理图谱研究的学术界、工业界同仁们,向这个方向迈出实质性的步伐。
因此,“语控万物”开放标准的建设是未来AI应用的绝对制高点。所有大语言模型和所有AI赋能的应用,最终都要向这个标准看齐和适配。只有这样才能实现大语言模型和垂直领域AI应用之间的无缝对接和协作,实现“语控万物”的愿景。