张一鸣迟到更迟

文 | 字母榜

进入9月,各大厂商纷纷将视频大模型作为AI的新焦点。在这股热潮中,张一鸣带着字节跳动的身影也加入了竞赛。距离阿里通义千问文生视频发布仅5天,6月份快手发布的可灵之后,字节终于在9月24日推出了自己的豆包·视频生成模型。值得注意的是,注重实用性且追求投资回报率的张一鸣,早在豆包模型发布之初就将“商业化”定为目标。

火山引擎总裁谭待在现场透露,豆包视频生成模型从诞生之初就考虑将其应用于商业领域,使用场景涵盖电商营销、动画教育、城市旅游和微剧本等多个领域,如音乐MV、微电影和短剧等。据某头部AI工具服务商介绍,对于像字节这样的大模型厂商来说,运用AI降低影视制作的成本,借助AI提升短剧和MV等内容的用户数量,已成为一种新的商业模式。

尽管如此,豆包视频生成模型在技术方面并未给用户带来太大的惊喜。然而,在适用性方面,豆包可以实现多种风格的切换、随机运镜等功能,兼容多种画面比例,相比只能提供特定画面比例的可灵,具有更大优势。首批内测用户张洋认为,尽管国内视频大模型厂商纷纷崛起,但豆包的技术实力并无太大差距。

随着视频大模型的普及,各大厂商纷纷加码布局。尽管Sora等厂商抢得了先机,但字节凭借丰富的内容和平台资源,有望在商业化道路上取得优势。然而,面对OpenAI GPT-o1等强化学习技术的冲击,字节能否把握住新一轮的发展机遇,还需拭目以待。

发表回复