国产Sora团队发布16秒动画:画面效果媲美OpenAI
近年来,AI视频生成的竞争愈发激烈,各大厂商纷纷研发新型AI模型。今日,国内一家名为生数科技的初创公司与清华大学联合发布了名为「Vidu」的视频大模型,引起了广泛关注。
生数科技联合创始人兼CEO唐家渝曾公开表示,今年内一定能达到Sora目前版本的效果。事实上,在生成时长、时空一致性、镜头语言、物理模拟等方面,Vidu的表现已经非常接近Sora,甚至在多镜头语言、时间和空间一致性、遵循物理规律等方面表现尤为出色。更为惊人的是,Vidu能在短时间内实现这样的突破,仅用了两个月的时间。
Vidu的最大亮点之一便是其生成视频的长度突破10秒大关,实现了画面连续流畅,且具有细节、逻辑连贯性。此外,Vidu还具备保持时间和空间一致性的能力,这在AI视频中并不容易实现。Vidu在生成过程中,人物的表情、服饰、场景的一致性得到了很好的维持,使得视频在连贯性和流畅性上有了质的飞跃。
值得一提的是,Vidu还能模拟真实物理世界的运动,如物体的移动和相互作用。其与Sora生成的效果高度相似,无论是轮胎扬起的灰尘、树林中的光影,还是在SUV行驶过程中的阴影变化,Vidu都能一一呈现。此外,Vidu还具备丰富的想象力,可以生成现实中不存在的情景,如罕见的“带有黑色车顶行李架的白色老式SUV在陡峭的山坡上行驶”的画面,以及“鱼缸女孩”的奇幻场景,这些都极大地拓宽了艺术表达的边界。
Vidu的研发团队生数科技是一支拥有深厚技术积累的专业队伍,他们专注于图像、3D、视频等多模态大模型领域的研究已达20余年。团队成员在国内外顶级学术会议发表论文近30篇,并在多个领域取得重要突破。Vidu的成功,充分展示了他们的技术实力和创新能力。
总之,Vidu的推出标志着我国在AI视频生成领域的技术取得了重要突破,相信在未来,Vidu将为我国的视频产业带来全新的发展机遇。