AI生成视频能否取代影视行业?
智谱AI发布AI视频生成技术“清影”,助力内容创作及传播
近日,我国人工智能领域领军企业智谱AI正式推出全新AI视频生成技术——“清影”。这一技术具有强大的文生视频和图生视频处理能力,能有效满足各类创意表现需求。据悉,“清影”已全面上线智谱清言App,为广大用户提供便捷易用的视频生成服务,无需预约,人人皆可使用。
智谱AI首席执行官张鹏表示,AI多模态技术源于人类大脑的工作原理。作为一种复杂的系统认知功能,人类大脑通过各个脑区的协作实现文字、视觉、听觉等多模态感知和理解。作为致力于实现通用人工智能的目标企业,智谱AI始终高度重视多模态技术的研究与应用。
清影技术基于智谱自研的视频生成大模型CogVideoX,经过技术优化,实现了推理速度的6倍提升,将6秒视频的生成时间缩短至理论上的30秒。此外,清影采用了一种融合文本、时间、空间三个维度的Transformer架构,以应对内容连贯性问题。同时,该技术引入了高效的三维变分自编码器结构(3D VAE),将原始视频数据压缩至原始大小的2%,降低了视频扩散生成模型的训练成本和难度。
智谱清言App提供文生视频和图生视频两种模式。文生视频适用于发挥想象力,如让小狗在指尖跳舞、海豚飞向太空等;图生视频则能挖掘原有图片的更多趣味,例如让旧照片中的人物动起来,使回忆更具生动感。
在商业化方面,智谱清影目前主要通过API进行付费。张鹏表示,尽管清影功能已经上线,但仍处于早期阶段,其纯商业化的时期尚未到来。他相信,随着技术进步和市场需求的增长,智谱清影有望在更多场景实现广泛应用。
总之,智谱AI发布的“清影”技术为内容创作和传播提供了有力支持,标志着我国人工智能技术在多模态领域的又一重要突破。未来,智谱AI将继续努力研发更先进的多模态模型,为广大用户提供更优质的产品和服务。