“百万AI模型融入学件基座,开启无限可能新篇章”
在人工智能的大模型时代,全球研究者纷纷追随OpenAI GPT系列的步伐,然而,也有不少专家选择在国产原创大模型的道路上深耕细作。南京大学副校长、国际人工智能联合会理事会主席周志华教授便是其中的佼佼者。他提出的“学件范式”创新性地从数据隐私的角度出发,通过构建基座系统,实现了模型的安全、可靠复用,满足了用户对个性化模型的需求。
周志华教授在MEET 2025智能未来大会上,从宏观与技术的双重角度,详细阐述了学件范式的最新进展,以下是对其演讲内容的编辑整理,以期为读者带来更多启发。
在大会上,周志华教授提出了学件范式的核心概念:学件=模型+规约。这里的规约,通过对模型进行细致刻画,使得模型即便在未知开发者数据的情况下,也能被复用。用户只需提出需求,学件基座系统便会自动匹配合适的模型或模型组合,以解决问题。
学件基座系统可视为一种异构大模型,它随着更多模型的提交而不断壮大和重组。未来,它不仅能提供服务,还具备一定程度上的可解释性,与现有的大模型存在显著差异。
以下是周志华教授在演讲中的主要内容:
学件范式:模型与规约的完美结合
周志华教授在演讲中首先阐述了学件的概念,并将其与计算机硬件和软件进行类比。他指出,学件是机器学习领域的一种全新形态,完全由我国自主研发。
针对未来机器学习解决世界问题的方向,周志华教授提出了六个关键问题,并逐一解答。他强调,在数据隐私保护的前提下,如何高效地复用和组装来自世界各地的模型,是学件范式所致力于解决的问题。
学件范式的核心在于“学件=模型+规约”,其中规约负责对模型进行刻画,确保模型在不暴露开发者数据的情况下得以复用。学件基座系统则像一个超市,为用户提供丰富的模型选择。
规约技术的安全性
周志华教授介绍,学件基座系统为开发者提供两个信息:k和n,分别代表某个函数和规约大小。开发者利用这些信息训练模型,并生成规约。提交模型时,需一并提交规约。
关于规约的安全性,周志华教授指出,通过理论证明,规约不会包含开发者的训练数据,即便面对强大的攻击手段,也能有效保护开发者数据。
学件基座系统的成长与演化
随着学件基座系统中学件数量的增加,如何使规约和系统本身得到成长,成为了一个重要问题。周志华教授团队采用了规约索引树、稀疏哈希等技术,实现了学件基座系统的可成长和可演化。
最后,周志华教授开源了北冥坞学件基座系统,并欢迎广大科研工作者共同参与研究。他表示,学件范式的研究目前对算力要求不高,且解决方案尚处于初级阶段,有兴趣的老师和同学可以加入到这一领域的研究中来。