Picsart AI 发布 T2V 模型,可生成 1200 帧 2 分钟视频

近日,我国科研团队发布了一款名为StreamingT2V的视频生成模型,该模型可以生成长达1200帧、时长为2分钟的高清视频,性能超过了之前的Sora模型。与此同时,StreamingT2V也是一款开源软件,可以与其他开源项目如SVD和animatediff兼容,进一步推动了开源社区的发展。

StreamingT2V采用了先进的自回归技术,可以在不影响视频质量的情况下,轻松地将视频帧数扩展至80、240、600甚至更长。相较于其他仅适用于短视频生成的模型,StreamingT2V在时长和帧数方面的突破具有重要意义。此外,StreamingT2V的关键组件包括条件注意力模块(CAM)、外观保留模块(APM)以及用于视频增强的随机混合方法,这些设计保证了视频在长时间生成过程中的平滑过渡和高品质。

据悉,StreamingT2V已经开源并在GitHub上提供免费试玩。尽管目前服务器负载较高,用户需耐心等待,但其强大的功能和兼容性仍引起了广泛关注。有专家表示,随着技术的不断进步,未来有望实现无限长的视频生成,甚至可能会改变影视和游戏产业的格局。

总之,StreamingT2V的诞生无疑为视频生成领域带来了新的里程碑。在未来,这款开源模型有望在多个领域发挥重要作用,推动人工智能技术的发展。

发表回复