MiniMax拟11月推GPT-4O级语音对话API

近日,我国AI领域独角兽企业MiniMax宣布,将于11月份发布一款针对GPT-4o的Realtime API服务。这款产品将大幅提升端到端实时多模态处理能力,实现更低延时、更自然、更沉浸式的实时语音对话,为企业和个人在协作、社交、直播、游戏等场景中提供强大支持。

据悉,这是MiniMax推出的首款端到端实时语音对话产品。内部团队正在对产品进行精心打磨,力争在11月发布时达到与国际先进水平相媲美的效果。

MiniMax此款Realtime API服务的发布,源于OpenAI于今年5月推出的全新旗舰AI模型GPT-4o。GPT-4o具有实时音频、视觉和文本推理能力,响应音频输入的速度可达232毫秒,平均320毫秒,与人类对话反应速度相当。相比去年11月发布的GPT-4-turbo,GPT-4o价格降低了50%,速度提升了200%。

OpenAI CEO奥尔特曼(Sam Altman)在推特上表示,GPT-4o是OpenAI历史上最好的模型,它智能、快速,支持原生多模态,并且可供所有ChatGPT用户使用,无论是免费版本还是付费GPT-4版。

与此同时,实时语音技术公司声网的兄弟公司Agora也参与了OpenAI的Realtime API公开测试版。MiniMax洞察到了这一市场机遇,开始与声网合作,打造中国首个Realtime API。该API的智能体产品能够与人类进行轻松流畅的实时语音交流。

值得一提的是,目前我国科大讯飞、智谱AI、商汤科技等企业也正在研发生成式AI对话产品,其效果与GPT-4o不相上下。OpenAI近期也开放了ChatGPT-4o对话功能。

根据艾瑞咨询的统计,2021年,对话式AI市场规模为45亿元,带动规模126亿元。预计到2026年,对话式AI市场规模将达108亿元,带动规模超385亿元,五年复合年均增长率(CAGR)达32.5%。MiniMax此次发布的Realtime API服务,有望为我国AI对话式市场带来新的活力。

发表回复