世界最强AI大模型易主了?昨晚,Claude 3系列模型发布,GPT-4时代终结?
3 月 4 日,被称为 OpenAI 最强竞争对手的大模型公司 Anthropic 宣布推出 Claude3 系列模型,与 Gemini 类似,模型按照大小分为三个:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。Opus 目前在官方发布的测试成绩中全方位超越 GPT-4 与 Gemini Ultra。
世界都在说,全球最强AI模型一夜易主。
用Anthropic的话说,Claude 3系列模型在推理、数学、编码、多语言理解和视觉方面,都树立了新的行业基准!
值得注意的是,这次发布的 Claude 3 系列都支持了图像识别能力,以及 200K 的上下文窗口,特定场景还能提供 1M tokens 的长文本输入能力。Opus 和 Sonnet 现在已经可以在 Claude.ai 官网和现在 159 个国家的 Claude API 中使用。Haiku 很快也将上线。我们可以依据自己的需求选用适合的模型,在在智能水平、处理速度和成本之间,找到最佳平衡。
一、目前最强大模型
Opus,是Claude 3系列中最先进的模型。尤其是,Opus在处理复杂任务时,展现了几乎与人类相媲美的理解和表达能力,是AGI领域的领跑者。另外,在大多数 LLM 评估基准上胜过同行,包括 MMLU、GPQA、GSM8K 等。所有 Claude 3 模型在数据分析和预测、内容创作、代码生成以及用西班牙语、日语和法语等非英语语言交流方面显示出更强的能力。
1、更快的反应速度Claude Haiku 是目前市场上同类 LLM 中性价比最高且响应最快的。它能在短短不到三秒钟内,阅读并理解 arXiv 上一篇包含图表和图形的信息量和数据密集型研究论文(大约 10k Token)。在产品发布之后 Anthropic 将进一步提升它的性能表现
就绝大部分工作而言,Sonnet 的速度是 Claude 2 和 Claude 2.1 的两倍,且能力更高。在需要迅速回应的任务,如快速信息检索或销售自动化方面,它的表现尤其出色。Opus 的速度与 Claude 2 和 2.1 相当,但其智能程度要高得多。
2、强大的视觉能力
Claude 3 模型具有与其他领先模型相媲美的复杂视觉能力。
它们可以处理各种视觉格式,包括照片、图表、图形和技术图纸。
特别是对那些知识库中高达 50% 的内容以 PDF、流程图或演示文稿幻灯片等不同格式存在的客户而言,这将非常有价值。
3、更少幻觉、高准确性以及减少对用户拒绝
以往的Claude模型往往会不必要地拒绝回应,反映了其对上下文的理解有所欠缺。与之前的版本相比,Opus、Sonnet和Haiku在显著减少对可能触碰到系统安全界限的问题的拒绝反应上取得了进展。如下所示,Claude 3模型展现出了对请求的更细致理解,能够更准确地辨识出真正的风险,并在对安全无害的提示上减少了不必要的拒绝。
与 Claude 2.1 相比,Claude Opus 在困难的开放式问题上展示了两倍的准确性提升,并且减少了错误回答的比例。Anthropic的研究者针对模型已知弱点,进行了复杂实际问题的评估。
他们将模型的回应分为正确、错误、不确定三种。其中不确定是指模型表示不知道答案,而非给出错误答案。除了提供更可靠的答案外,Anthropic 宣布还将在 Claude 3 模型中启用引用(citations)功能,使其能够指向参考材料中的确切句子来核实它们的回答。
二、Claude 3 总结及价格介绍Claude 3 Opus
能力最强,在高度复杂的任务上表现出了市场上最好的性能。它能够轻松应对各种开放式提示和未知场景,并以出色的流畅度和人类般的理解能力完成任务。Opus 展示了生成式 AI 所能达到的极限。
Claude 3 Sonnet在能力和速度之间取得了理想的平衡—尤其适用于企业级工作负载。与其他同类产品相比,它在提供强大性能的同时成本更低,并且经过优化,能够在大规模 AI 部署中长时间稳定运行。
Claude 3 Haiku目前最快速、最轻便的模型,能够提供几乎即时的响应能力。它可以极快地解答简单的问题和响应请求。用户将能创建流畅的 AI 体验,仿佛是与真人互动一般。
三、Claude 3 模型使用方法方法一:Opus和Sonnet目前已在Anthropic的API中对外开放,开发者可进行注册并立即使用这些模型。Haiku也将在不久的将来推出。在Claude.ai的网站上,Sonnet已经提供了免费试用,而Opus则已经向Claude Pro的订阅用户开放。
方法二:
打开沃卡API网站:https://4.0.wokaai.com,注册后生成自定义key,参考调用OpenAI 模型的方法即可调用Claude 3系列模型。
官方透明计价!