在经历了语言模型、检索增强模型以及多模态技术等多波技术热潮的洗礼之后,AI智能体的发展现状如何?近期,Langbase公司发布了一份基于11个关键问题的调查报告,为我们呈现了这一领域的现实状况。该报告基于来自100多个国家的3400名开发者的深入调研结果,其中46%为企业管理层,26%为工程师。Langbase致力于提供无服务器AI云开发体验,作为一个提供可组合基础设施的AI平台,他们在2024年共处理了3.6万名开发者的1840亿个token和7.86亿个API请求。Langbase虽然成立时间不长,成立于2023年,但在今年9月已完成pre-seed轮融资,并获得了包括谷歌、苹果、OpenAI和微软等科技巨头高管的资金支持。
以下为Langbase发布的报告中提到的主要内容:
1. 开发者所使用的基座大模型:在这场AI智能体竞赛中,OpenAI的大模型服务占据主导地位,而谷歌则迅速崛起,成为其强劲对手。Anthropic紧随其后,Meta的Llama、Mistral和Cohere虽然影响力较小,但增长势头不容忽视。
2. 不同大模型对应的具体用途:OpenAI的大模型在翻译任务中广泛应用,Anthropic在技术任务中备受青睐,谷歌的模型在健康和翻译领域占据主导地位。此外,Meta在科技和科学应用中得到广泛使用,Cohere在多个领域得到重视,包括科学和营销。
3. 阻碍大模型技术应用的因素:在模型的扩展和部署中,数据隐私和安全合规性成为主要关注点,同时,缺乏监控工具和高基础设施成本也阻碍了技术的落地应用。
4. 影响大模型选择的因素:在选择大型语言模型时,准确性是最重要的因素,其次是安全性和可定制性,成本的影响相对较小。
5. 部署大模型时遇到的最大挑战:在生产环境中部署大模型和智能体面临诸多挑战,包括定制困难、质量保证评估方法有限,以及缺乏可重用的基础设施。此外,工具碎片化、集成问题和可扩展性等方面的顾虑进一步复杂化了这个过程。
6. 采用大模型技术时的主要目标:自动化和简化是AI应用的首要任务,使公司在效率和流程简化方面受益;同时,定制解决方案和提升合作流程等方面的目标,反映了大模型日益增长的灵活性,以及消费者对系统共享访问的兴趣。
7. 公司如何使用大模型智能体:LLM在软件开发中得到广泛应用,尤其在市场营销、IT运营和文本摘要等方面,客服、人力资源和法律领域的使用兴趣也在日益增长。
8. 对平台特征的关键需求:大多数受访者需要多智能体检索增强生成(RAG)功能以提高上下文信息处理,同时,评估工具对于确保人工智能系统按预期工作也很重要。
9. 编排AI流水线时开发者偏好的工具:大多数受访者更喜欢能提供灵活、基础原语的开发工具以设计定制AI流水线。
10. 影响大模型智能体开发工具选择的因素:开发者将AI智能体的版本控制视为开发平台最重要的功能。强大的SDK或库生态系统以及本地开发环境也受到重视。
11. 大模型在公司中的应用程度:大多数开发者将AI用于实验和生产。虽然实验用途的比例远大于生产用途,但后者比例仍在稳步增长。
随着AI智能体基础设施的成熟,未来将有更多企业尝试开发智能体。随着多模态及大模型操作计算环境的发展,智能体在2025年的应用将更加广泛,不仅限于软件开发、市场营销、IT运营和文本摘要等领域。然而,调查结果也揭示了开发者关注的问题,例如对准确性、安全性和可定制性的重视,以及偏好灵活、可定制的AI流水线开发工具,并重视AI智能体版本控制功能。这些发现对智能体平台及开发者具有重要的参考价值。