百度领投!生数科技获数亿元Pre-A轮融资,打造多模态大模型
生数科技完成数亿元Pre-A轮融资,加速多模态通用大模型研发及市场拓展
近日,生数科技宣布已完成数亿元Pre-A轮融资,本轮融资由百度、北京市人工智能产业投资基金领投,中关村科学城公司、启明创投等跟投。据悉,本轮融资完成后,生数科技将继续秉持原生通用多模态技术路线,不断迭代优化自研大模型,加速产品开发与市场拓展。
生数科技作为我国最早布局多模态通用大模型的团队之一,今年4月联合清华大学发布了国内首款全面对标OpenAI Sora的视频大模型Vidu。未来,生数科技计划基于百度百舸·AI异构算力平台持续训练、提升模型能力,并逐步通过百度智能云千帆平台开放模型服务。
百度集团执行副总裁、百度智能云事业群总裁沈抖表示,投资生数科技是百度在多模态大模型领域的重要战略布局。未来,百度将发挥自身在AI异构算力、大模型平台、生态等方面的独特优势,助力生数科技加速技术研究与创新,快速打通商业成功路径,共同推动产业发展。
生数科技核心团队来自多个海内外顶级学术机构和科技企业,早在2021年就率先开始了扩散模型研究,是国内最早研究深度生成模型的团队之一。其提出的免训练推断算法 Analytic-DPM、全球最快采样算法 DPM-Solver 等技术,已被 Stable Diffusion、DALL·E 2 等图像模型广泛采用。2022年,生数科技提出了全球首个Diffusion与Transformer融合架构U-ViT,并在半年后再次取得重大突破,开源全球首个基于此融合架构的多模态扩散模型 UniDiffuser,成功验证了大规模训练融合架构的可行性与涌现能力。
自成立以来,生数科技一直致力于采用U-ViT融合架构处理多模态数据,持续探索大模型在图像、3D、视频等多模态生成任务下的性能边界。2024年初,OpenAI推出视频大模型Sora,其背后采用的融合架构Diffusion Transformer和原生多模态技术路线引发了行业关注,而此时生数科技对此技术路线的布局已持续超过一年。今年4月,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu,性能全面对标Sora,成为多模态大模型领域在全球范围内的又一重大技术突破。
此外,生数科技已陆续推出了视觉创意设计平台PixWeaver、3D资产构建工具VoxCraft两款应用产品,并与多家合作伙伴携手,将多模态大模型应用于游戏、影视、文旅、智能终端等场景。百度副总裁陈一凡表示,百度百舸针对大模型训练、推理等任务,对智算集群进行了全面优化,实现了业界领先的算力效能。结合千帆平台提供的大模型全流程工具链,能够支持生数科技开发出最优的多模态大模型。
展望未来,生数科技将继续努力,以及更多优秀的大模型基于百舸、千帆进行模型训练和迭代,共同发掘大模型在更多场景中的应用潜力,深度赋能政务、交通、能源、制造、金融等行业,为我国实体经济发展贡献力量。