Veo 2 AI视频新力作:4K画质,感知升级
12月17日,谷歌公司宣布推出新一代视频生成模型Veo 2。该模型在理解现实世界物理、人类动作和表情细节方面取得了显著进步,进一步提升了视频的细节和逼真度。
Veo 2模型能够生成高达4K分辨率的视频,时长可达2分钟。与OpenAI的Sora模型相比,Veo 2的分辨率是其4倍,时长是其6倍。然而,在谷歌实验性视频创建工具VideoFX中,Veo 2的分辨率上限为720p,视频长度为8秒。DeepMind产品副总裁Eli Collins表示,未来几个月内,团队将根据用户反馈继续优化模型。
与Veo相同,Veo 2能够在给定文本提示或文本和参考图像的情况下生成视频。此外,Veo 2还能够更真实地模拟运动、流体动力学和光的属性,包括多种镜头和电影效果,以及“细腻入微”的人类表情。DeepMind表示,为了降低Deepfake的风险,他们利用专有的水印技术SynthID,将隐形标记嵌入到Veo 2生成的每一帧中。
以下为Veo 2模型生成的部分实例:
实例1:场景描述为摄像机轻柔地穿过一排粉彩涂漆的木制蜂箱,蜜蜂在镜头中穿梭,镜头随后对准站在中央的农夫,他穿着洁白的养蜂服,手中举起一罐蜂蜜。
实例2:中景照片展现了一位卡通女孩,留着波浪状的棕色头发,端坐在1980年代的厨房里,她兴奋地对着摄像机说话。
实例3:低角度镜头捕捉到一群粉红色火烈鸟优雅地涉水在郁郁葱葱的泻湖中,它们的羽毛在阳光下闪耀,形成美丽的倒影。
此外,IT之家还提供了更多Veo 2模型的演示视频,供大家欣赏。