跳至正文

上海交大重庆AI研究院齐鹏团队:大模型水平仅五岁孩童

近日,关于多个 AI 大模型在回答“9.11和9.9哪个更大”这类基础数学问题时表现不佳的消息引发了热议。上海交通大学重庆人工智能研究院(沪渝人工智能研究院)AI大模型中心主任齐鹏博士在接受钛媒体采访时透露,尽管大模型具有巨大的潜力,能处理复杂问题并具备学习泛化能力,但其数学能力较差,存在诸多问题亟待解决。

齐鹏认为,大语言模型由于模型架构限制,更像是“文科生”,缺乏理科能力。而且当前受算力不足、文本数据不足、精确度和可靠性有偏差以及模型规模不够大等因素制约,其智能水平仍在孩童级别,难以处理复杂任务,“幻觉”长期存在。

然而,齐鹏也强调,大模型在多个垂直行业都有广泛的应用前景。他带领团队研发的“兆言”大语言模型在今年3月的SuperCLUE中文大模型智能体评测基准中排名全球第三、国内第二。此外,团队还成功复现了类Sora文生视频模型,在视频生成领域取得重要进展。

齐鹏表示,当前大模型发展面临两大瓶颈:一是大语言模型架构限制导致智能水平有限;二是大模型作为机器学习范畴,其统计方法本质决定其难以做到百分百准确。他认为,通过完善配套设施和工具,可以弥补大模型的不足,使其更好地适应应用场景需求。

发表回复