商汤徐立谈AI2.0:算力引领应用巅峰
12月6日至7日,2024年T-EDGE创新大会暨钛媒体财经年会在北京市大兴区隆重举行。本次大会以“ALL-in on Globalization,ALL-in on AI”为主题,汇聚了全球科技和商业领域的杰出领导者,共同探讨人工智能对全球各行业产生的深远影响,以及企业全球化发展的新格局和新趋势。
作为钛媒体集团年终举办的科技与财经领域的顶级盛会,T-EDGE一直代表着集团在科技与经济前瞻性以及推动国际创新交流上的高水准追求。12月7日,T-EDGE全球AI论坛“ALL-in On AI”会议中,商汤科技董事长兼CEO徐立博士以“AI 2.0的思考与挑战”为主题,深入探讨了AI大模型发展背后的算力、模型和应用“三位一体”等问题。
徐立博士认为,AI的每一次突破都伴随着“超级时刻”的出现。他以今年诺贝尔奖这一“超级时刻”为例,指出人工智能作为工具助力化学领域实现突破,同时物理学作为工具反向推动了AI技术的发展。这种现象表明,学科作为工具与目标同时被验证,通常需要长时间的积累,而同一年出现则反映了人工智能加速学科交叉迭代的强大力量,以及AI技术发展速度的迅猛。
面对AI 2.0的下一阶段发展,徐立博士提出,我们正在加速构建一个全新的产业,即输入能源,输出数字智能。今年下半年,全球众多领先科技企业如OpenAI、马斯克的xAI、谷歌、微软、甲骨文等,均在算力板块进行了快速且重量级的布局。
徐立博士以特斯拉为例,指出其GPU数量在一年内增长了9倍,预计年底将达到9万块H100。他还表示,这一现象背后的核心原因在于“尺度定律”被发现并连续在大语言模型、跨模态任务以及慢思考推理中得到验证,成为AI 2.0的理论基石。
在徐立博士看来,AI 2.0背后的关键在于如何进行资源衡量。通过对LeNet-5、AlexNet和GPT-4三代经典模型的数据对比,他发现AI发展过程中成本结构发生了巨大变化,GPT-4的资源需求已达到数千倍至百万倍的增长。
在这样的大背景下,徐立博士强调,这不仅是技术优化的问题,更是新基础设施建设的时代命题。未来十年,除了构建高阶思维链数据、实现真正模型的差异化外,更重要的是如何进一步优化算力成本、形成行业核心壁垒,这将决定AI的普及速度和商业化潜力。
商汤科技在AI 1.0时代十年的摸爬滚打中,更加清晰地认识到“可持续”的重要性,并在面对AI 2.0的快速变化中更加“老练”。徐立博士表示,近期公司确立了“大装置-大模型-应用”的三位一体战略,旨在解决训练和推理成本大幅下降、如何有效利用模型等问题,以指导下一个阶段的算力发展,赋能通用人工智能(AGI)的长远未来。
截至目前,商汤AI大装置SenseCore已拥有超过5.4万块GPU,总算力规模高达2万petaFLOPS,能够支持超过20个千亿超大模型同时训练,并支持万亿参数大模型的全生命周期生成。去年,商汤成为中国第三大智算服务商,与腾讯、字节、阿里、百度等企业一同提供AI智算服务。
徐立博士强调,2025年将成为“数据中心之年”。AI基础设施建设将以更高效、更普惠的方式推动社会进步。通过不断突破技术与认知的边界,AI将助力人类探索更多未知的可能性。