通用人工智能如何赋能千行百业?业界热议大模型发展路径
随着以ChatGPT为代表的通用人工智能大模型的出现,大模型逐渐成为驱动社会生产力、生产效率发生巨大变化的新引擎。在日前举行的2023(第二十二届)中国互联网大会“大模型的发展路径”论坛上,与会行业专家围绕“大模型时代,通用大模型、行业大模型及相互协同的发展路径”等人工智能大模型领域热点问题展开了讨论。
需加快建立人工智能开源开放生态
针对通用人工智能的定义及发展现状,北京智源人工智能研究院院长黄铁军指出,“通用人工智能”往往对应GAI(General Artificial Intelligence)和AGI(Artificial General Intelligence)两个概念,GAI是指(具有)通用性的人工智能,AGI严格意义上叫做人工通用智能。两者的含义具有根本性差别,通用人工智能强调的是通用性,而AGI强调的是全面超越人类的一种人工智能。“今天我们说的大模型,实际上是指从通用人工智能向真正超(越)人的人工智能的过渡阶段。”
“一个大语言模型是把人类的所有语言,主要是书面语言,训练成一个千亿、万亿的神经网络,从而具备了融会贯通的能力。”黄铁军表示,不同于传统IT系统的确定性,如今真正的智能已经出现,“从某种意义上讲,这种模型背后有其自己对世界模型空间的认知”。
2022年11月,ChatGPT一经推出便掀起大模型发展的热潮,迄今国内已有八十余个大模型公开发布。
针对当前通用大模型研发应用现状,黄铁军强调,要建立开源开放的生态。“从技术体系演进来看,英特尔联盟在技术上主导了PC时代,移动互联网时代iOS和Android两个生态主导了迄今为止手机的生态。进入智能时代,这样的生态也一定会出现,且正在出现。”
黄铁军指出,目前国内存在的一个问题是从“大炼模型”变成“大炼大模型”,造成严重资源浪费。“一个大模型的聪明程度、智力程度,甚至能不能代替科研人员发现新的物理定律,是我们追求的。”他认为,对中国而言,很多企业机构都能训大模型,关键在于大家要通过开源方式联合迭代创新,(推动行业发展)往前走。
大模型落地行业需解决安全、可信等问题
早在今年2月13日,北京市经济和信息化局正式发布《2022年北京人工智能产业发展白皮书》,提出全面夯实人工智能产业发展底座。支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。
4月28日召开的中共中央政治局会议提出,“要重视通用人工智能发展,营造创新生态,重视防范风险”,为通用人工智能行业发展指明了方向。
如何让通用人工智能赋能各行各业的发展?现阶段还面临哪些挑战?未来有哪些发展路径?
华为云大数据与AI总经理李伟指出,不同于传统AI时代AI技术分支众多,业内做了很多小模型,Transformer架构的提出,为业界带来这样的机会,即通过预训练、超级大规模数据让大模型具有极高的泛化能力、海量数据和强大的拟合能力,从而突破精度的限制,一个大模型可以覆盖多个场景。
“早期的视觉、语音、语义、生成能力等海量离散小模型逐渐汇聚成了大模型。当前To C基础能力应用拓展到To B通用场景能力”,李伟同时表示,通用大模型落地行业存在三个挑战,一是大模型通用性强,但专业能力是比较弱;二是大模型知识虽然多,但技能不足;三是数据的安全合规问题,数据是企业核心资产之一,大模型可以有效地存储和挖掘知识,但训练和使用大模型需要保障企业数据安全合规。
中国移动集团级首席科学家冯俊兰也指出,大模型相关理论核心技术在不断突破,智能水平大幅提升,同时可控性、安全性、可信性是亟需攻关的。“攻关思路是依托现在泛在的算的资源、网的资源,在开放环境中对AI能力进行灵活地配置、调度部署,以满足日益复杂的需求。”
“每一个行业总体来看都是一个非常复杂的系统,怎么能够在这样的复杂系统去真正集成好(数据、知识和各种系统),现在的大模型还有很大挑战。”冯俊兰认为,大小模型协同、人机协同将是未来行业发展的路径。
针对大模型如何进入千行百业,中国信通院云计算与大数据研究所副所长魏凯表示,未来大模型发展一个路径是从基础模型到行业模型的路径,第二个是模型即服务的发展。“未来可能是大模型驱动小模型,模型即服务可能是相互嵌套的”“一个模型调用另用一个模型,把这些模型缝合起来、串联起来、并联起来完成一个复杂的场景具体任务”。
北京智源人工智能研究院副院长、总工程师林咏华表示,通用大模型是行业大模型重要的基础。首先,通用大模型是知识体系的基础,不能强求通用大模型里面包含所有行业的专业知识。其次,通用大模型或者基础模型是下游行业模型很重要的能力框架。同时,通用模型自身发展需要跟行业模型进行相辅相成的配对或者迭代。