GPT-4o语音开放:与AI进行更自然对话

OpenAI 推出 GPT-4o 语音模式,语音交互体验将得到提升

近日,全球人工智能领域领军企业 OpenAI 宣布向部分 ChatGPT Plus 用户开放 GPT-4o 的语音模式。这一功能将在今年秋季逐步推广至所有 ChatGPT Plus 订阅用户。GPT-4o 是 OpenAI 首个结合文本、视觉和音频模式的全新统一模型,其语音模式具有快速反应、声音堪比真人的特点。

据悉,GPT-4o 的语音模式能够感知语音中的情感语调,如悲伤、兴奋或歌唱。此外,OpenAI 公司还强调 ChatGPT 将不会假冒他人的声音,包括个人和公众人物的声音,并会阻止与预设声音不同的输出。

在 GPT-4o 语音模式下,用户的语音交互体验将得到显著提升。然而,OpenAI 也提醒用户,GPT-4o 并非无所不能,其在功能和使用场景上仍需不断探索和尝试。随着技术的进步,未来 GPT-4o 可能将应用于更多的场景,例如智能客服、智能家居等领域。

总之,OpenAI 推出 GPT-4o 语音模式标志着人工智能技术在自然语言处理和语音识别等方面的又一重要突破。然而,要让这一技术真正实现广泛应用,还需研究人员和企业持续投入精力,共同推动人工智能的发展。

发表回复