“大模型”2023影响中国人工智能产业进程的10大模型

10 8 月 2023

“大模型”2023影响中国人工智能产业进程的10大模型

来源：高校大数据与人工智能推进联盟

2023年，生成式人工智能和AI聊天机器人背后的大模型，竞争激烈，令人疯狂。尤其是在OpenAI发布ChatGPT之后，大公司、小公司和开源社区更是争先恐后的推出自己的大模型。据统计，到目前为止，全国已经发布了数百个大模型。但是，哪些大模型最受关注和最具发展潜力？哪些大模型最具价值和创新要素？

近日，全国高校人工智能与大数据创新联盟对市场上比较活跃的大模型产品进行了梳理，从中推选出2023影响中国人工智能产业进程的十大模型，分别是清华大学“chatglm”大模型、百度“文心”大模型、华为云“盘古”大模型3.0、复旦大学“moss”大模型、科大讯飞“星火认知”大模型、商汤“日日新商量SenseChat”大模型、阿里云“通义千问”大模型、京东云“言犀”大模型、网易有道“子曰”大模型、学而思数学大模型“MathGPT”。

NO1.清华大学“chatglm”大模型

由清华大学教授唐杰团队研发的chatglm大模型，目前位列国内大模型开源领域影响力前列。2023年6月，清华大学KEG和数据挖掘小组(THUDM)发布了第二代ChatGLM2-6B大模型。ChatGLM-6B是国产开源大模型领域最强大的的大语言模型之一，因其优秀的效果和较低的资源占用在国内引起了很多人的关注。第一代的ChatGLM2-6B是一个非常优秀的聊天大语言模型，它的部署成本很低。相比较第一代，第二大的ChatGLM2-6B模型主要有四点升级：升级1：基座模型升级，性能更加强大；升级2：更长的上下文；升级3：更高效的推理，更快更便宜；升级4：更加开放的协议。根据官方的说明，ChatGLM2-6B的资源占用更低，速度更快。其次是资源占用降低，在不同的量化水平下，相同显存支持的对话长度提升约8倍！对于大模型的未来发展，唐杰提出三点思考，一，目前的千亿模型能力已经很强大了，未来重要的是如何把它的智慧提炼发挥出来；二、大模型如何跟外界进行交互；三、如何让大模型具有反思能力，能自我反思，自我纠错，并且具有一定的价值观，具有一定的意识。

NO2.百度“文心”大模型

百度文心大模型源于产业、服务于产业，是产业级知识增强大模型。百度通过大模型与国产深度学习框架融合发展，打造了自主创新的AI底座，大幅降低了AI开发和应用的门槛，满足真实场景中的应用需求，真正发挥大模型驱动AI规模化应用的产业价值。文心大模型的一大特色是“知识增强”，即引入知识图谱，将数据与知识融合，提升了学习效率及可解释性。文心ERNIE自2019年诞生至今，在语言理解、文本生成、跨模态语义理解等领域取得多项技术突破，在公开权威语义评测中斩获了十余项世界冠军。2022年11月30日，由深度学习技术与应用国家工程研究中心主办、百度飞桨承办的WAVE SUMMIT+2022深度学习开发者峰会举行 [29] 。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜发布文心大模型的最新升级，包括新增11个大模型，大模型总量增至36个[30] ，构建起业界规模最大的产业大模型体系，并通过大模型工具与平台的升级和文心一格、文心百中等基于大模型技术的产品应用，进一步降低大模型产业化门槛，让更多企业和开发者步入AI应用的新阶段。2023年6月，百度文心大模型3.5版本已内测可用。

NO3.华为云“盘古”大模型3.0

华为云盘古大模型，是华为旗下的盘古系列AI大模型，包括NLP大模型、CV大模型、科学计算大模型。2020年11月，盘古大模型在华为云内部立项成功，也完成了与合作伙伴、高校的合作搭建。2021年4月，盘古大模型正式对外发布。2023年7月7日，华为开发者大会2023上，华为常务董事、华为云CEO张平安宣布，华为云盘古大模型3.0正式发布。盘古大模型3.0是完全面向行业的大模型，包含L0基础大模型、L1行业大模型及L2场景模型三层架构，重点面向政务、金融、制造、医药、矿山、铁路、气象等行业。7月18日，华为联合山东能源集团宣布华为盘古大模型在矿山领域实现首次商用，解决人工智能在矿山领域落地难的问题。

NO4.复旦大学“moss”大模型

由复旦大学自然语言处理实验室邱锡鹏教授团队发布的MOSS大模型是国内第一个对话式大型语言模型。2023年4月21日，复旦大学计算机科学技术学院自然语言处理实验室开发的新版MOSS模型已上线，成为国内首个插件增强的开源对话语言模型，支持搜索引擎、图像生成、计算器、方程求解器等插件工具。除了完成升级迭代，MOSS模型还走上了开源道路，相关代码、数据、模型参数已在Github和Hugging Face等平台开放，供科研人员下载，促进人工智能模型研究和开源社区的生态繁荣。目前，MOSS项目的代码、数据、模型参数已在一些平台开放。开源代码涵盖模型训练和推理代码，开源数据包括超100万条对话训练数据，开源模型包括160亿参数中英双语基座语言模型、对话模型以及插件增强的对话模型。未来，MOSS将陆续开源更多训练数据及模型参数，促进人工智能领域的科学研究和开源社区的生态繁荣，同时也为企业私有化部署人工智能模型、开展相关服务提供解决方案。复旦大学自然语言处理实验室，是由复旦大学首席教授吴立德先生创建，是我国最早开展自然语言处理和信息检索研究的实验室之一。经过40余年发展，在自然语言处理底层分析、文本检索、自动问答、社会媒体分析等方面取得了一系列的研究成果。

NO5.科大讯飞“星火认知”大模型

2023年5月6日，科大讯飞正式发布“讯飞星火认知大模型”，产品具有7大核心能力，即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。2022年12月，科大讯飞启动“1+N”大模型技术攻关。其中，“1”指的是通用认知智能大模型算法研发及高效训练方案底座平台，“N”指的是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。2023年8月2日，讯飞星火APP已在苹果应用商店上架，版本更新为1.3.04。科大讯飞在互动平台表示，“讯飞星火APP正在升级优化，华为应用商店的讯飞星火APP新版本已于8月1日升级完毕。苹果商店尚在更新中。讯飞星火认知大模型V2.0升级发布会将于8月15日举办，届时会发布多模态生成、代码生成能力及行业产品等多项能力及应用。

NO6.商汤“日日新商量SenseChat”大模型

2023年4月，商汤科技董事长兼首席执行官徐立宣布推出“日日新SenseNova”大模型体系。日日新（SenseNova）大模型体系，包括自然语言处理模型“商量”（SenseChat）、文生图模型“秒画”和数字人视频生成平台“如影”（SenseAvatar）等。2023年4月10日，商汤科技举办技术交流日活动，分享了以“大模型+大算力”推进AGI（通用人工智能）发展的战略布局，并公布了商汤在该战略下的“日日新SenseNova”大模型体系。其中，商汤研发的大语言模型被命名为“商量SenseChat”。“商量SenseChat”在活动现场展示了多轮对话和超长文本的理解能力。包括：编程助手，可帮助开发者更高效地编写和调试代码；健康咨询助手，为用户提供个性化的医疗建议；PDF文件阅读助手，能轻松从复杂文档中提取和概括信息。

NO7.阿里云“通义千问”大模型

通义千问，是阿里云推出的一个超大规模的语言模型，功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互，也融入了多模态的知识理解，且有文案创作能力，能够续写小说，编写邮件等。2023年4月7日，“通义千问”开始邀请测试，4月11日，“通义千问”在2023阿里云峰会上揭晓。4月18日，钉钉正式接入阿里巴巴“通义千问”大模型。

NO8.京东云“言犀”大模型

2023年7月13日，京东言犀大模型正式对外亮相。言犀大模型融合70%通用数据与30%数智供应链原生数据，具有更高产业属性、更强泛化能力、更多安全保障等优势，其已经可将原本需要10余名科学家花费一周时间才能完成的定制化开发工作缩短至数分钟。京东还发布了全新升级的优加DaaS和言犀智能服务平台，其可以面向零售、金融、城市、健康、物流五大领域的行业提供定制化解决方案。对于“言犀”大模型的应用实践，京东也有“三步走”规划。目前，京东云已经基于内部实践构建了通用大模型；到今年年底这段时间，京东将经由高复杂场景大规模锤炼，迭代出扎实的产业服务；预计在2024年初，会将大模型能力向外部延伸商业场景开放。目前，京东已经走到第二步，并在内部取得了丰富的实践成果。

NO9.网易有道“子曰”大模型

2023年7月26日，网易有道发布国内首个教育大模型“子曰”以及六大创新应用成果，覆盖口语训练、作文批改、习题答疑等领域，展现了“子曰”大模型在自然语言处理领域的技术实力及广泛应用前景。大模型“子曰”能为学生提供个性化的分析和指导，实现引导式学习，还具备全科知识整合能力。通过连接多模态知识库、跨学科整合知识内容，大模型能随时满足学生的动态需求，帮助孩子培养更综合的能力。“子曰”大模型在教育行业的应用，不仅可以帮助学生更好地学习，也可以帮助老师更好地教学，借此实现因材施教的教育战略。

NO10.学而思数学大模型“MathGPT”

2023年5月，学而思宣布正在研发一款面向全球数学爱好者和科研机构的自研数学大模型，名为MathGPT。与通用语言模型不同，该大模型专注于解题和讲题算法，旨在弥补通用语言模型在数学问题解决、讲解、问答和推荐方面的不足。学而思AI团队负责人表示，通用语言模型虽能在文本处理方面表现出色，但在数学领域的表现却存在明显不足。MathGPT将通过解决现有通用语言模型的三个问题来弥补这一不足：提高题目解答的准确性、稳定性和清晰度，让解题过程更能够适配不同年龄段的学生。在人工智能领域的多年深耕使得学而思有能力自主研发MathGPT。学而思拥有20年的数学教学经验，其海外业务Think Academy在全球多个国家和地区深受数学爱好者喜爱，并在每年的IMO和AMC等国际数学竞赛中表现优异。

来源：高校大数据与人工智能推进联盟

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友，扫下方二维码加入我们人工智能交流群

分秒AI研究院

分秒AI研究院

“大模型”2023影响中国人工智能产业进程的10大模型

分秒AI研究院

发表回复取消回复

分秒AI研究院

分秒AI研究院

“大模型”2023影响中国人工智能产业进程的10大模型

“大模型”2023影响中国人工智能产业进程的10大模型

分秒AI研究院

发表回复 取消回复

发表回复取消回复