大模型API成本锐减，实时互动AI未来可期

28 10 月 2024

大模型API成本锐减，实时互动AI未来可期

在近日举办的RTE 2024实时互联网大会上，声网创始人兼CEO赵斌发表了重要讲话，指出随着OpenAI GPT-4o等多款实时语音对话类模型的问世，RTE技术正迎来新一轮的发展高潮。

赵斌表示，美国OpenAI近期大幅下调自身API调用成本和价格，这一举措对中国市场同样产生了影响，价格战硝烟四起。同时，算法和模型创新层出不穷，竞争激烈。在他看来，生成式AI技术将为RTE和实时互动带来无限想象空间，拥有巨大的技术潜力。

赵斌强调，未来10年至20年，无论是PC还是智能手机，都将以支持大模型能力在端侧的应用、推理能力提高和成熟为主要进化方向。生成式AI正在推动IT行业发生重大变革，这一趋势主要体现在终端、软件、云和人机界面四个方面。声网将与国内大模型独角兽MiniMax合作，打造中国首个Realtime API。

据悉，声网成立于2014年，是全球领先的实时互动云服务商，面向社交直播、教育、游戏电竞、IoT、AR/VR、金融、保险、医疗、企业协作等多个领域提供PaaS（平台即服务）、实时互动云等技术服务。2020年6月底，声网母公司Agora, Inc.（NASDAQ:API）在纳斯达克上市。2023财年第一季度业绩报告显示，为提高运营效率，Agora, Inc.旗下将声网和Agora运营两个独立公司，美国和国际业务以Agora品牌运营，中国业务以声网品牌运营。

赵斌认为，此次战略重组将有助于将资源最佳地集中在每个业务的优先事项上，推动Agora业务的增长并更有效地竞争声网业务。同时，新的组织结构也将使公司更加敏捷。

在最新财报中，Agora, Inc.集团2024财年第二季度总收入3420万美元，同比增长0.5%。其中，声网国内收入1.319亿元人民币（1860万美元），较去年同期增长0.3%。截至2024年6月30日，声网活跃客户数量达3774家，过去12个月内净留存率达79%。

随着全球经济的复苏以及科技转向AI技术，生成式AI赛道前景广阔。麦肯锡最新报告显示，2023年，全球生成式AI市场规模达到670亿美元，预计到2027年、2032年分别达到3990亿美元和1.3万亿美元，2023-2032年10年的复合增长率高达42%。

OpenAI公司推出的免费全新旗舰AI模型GPT-4o，在音频、视觉和文本推理方面表现出色，响应速度与人类对话中的反应速度一致。相比GPT-4-Turbo，GPT-4o价格降低一半（50%），速度提升两倍（200%）。

声网和Agora作为OpenAI的语音API合作伙伴，在Realtime API公开测试版中引起关注。在过去的十年里，RTE能力在各种手机应用和软件中的穿透力不断提升，目前超过10%，以每年1%的速度持续增长。

赵斌在演讲中发布了声网RTE+AI能力全景图，涵盖实时AI基础设施、RTE+AI生态能力、声网AI Agent、实时多模态对话式AI解决方案、RTE+AI应用场景五个维度，展示了当前RTE与AI结合的技术能力与应用方案。

赵斌表示，生成式AI正在推动终端、软件、云和人机界面四个层面的变革。在终端上，大模型能力将推动PC和Phone向AI PC和AI Phone的方向进化；在软件上，所有软件将通过大模型重新实现，从Software with AI发展至AI Native Software；在云层面，所有云都需要具备对大模型训练和推理的能力，AI Native Cloud将成为主流；人机界面的主流交互方式将从键盘、鼠标、触屏变成自然语言对话界面（LUI）。

此外，会议还讨论了红杉资本合伙人David Cahn提出的“AI支出6000亿美元难题”，即AI基础设施的巨额投资和实际收入之间差距过大。Lepton AI创始人兼首席执行官贾扬清认为，通过蒸馏、压缩等技术，同等尺寸的模型能力将越来越强，开源架构的应用将越来越普遍。

Hugging Face工程师王铁震表示，AI取代人类担忧过早，但AI已对某些行业产生负面影响，如视频以假乱真对青少年心理的影响等。MiniMax合伙人魏伟强调，随着多模态的出现，生成式AI的边界将持续拓展，为艺术、影视、音乐等领域的创作者提供更多效率，加速相关产业的变革。

赵斌最后表示，过去十年，实时互动从理念发展成一个行业，助力多个行业和场景实现跨越式成长。我们有理由期待下一个十年更为波澜壮阔和激动人心，开创生成式AI时代下的RTE新篇章。

分秒AI研究院

分秒AI研究院

大模型API成本锐减，实时互动AI未来可期

分秒AI

发表回复取消回复

分秒AI研究院

分秒AI研究院

大模型API成本锐减，实时互动AI未来可期

大模型API成本锐减，实时互动AI未来可期

分秒AI

发表回复 取消回复

发表回复取消回复