世界首份大模型安全标准发布:我国企业积极参与

世界数字技术院(WDTA)在第27届联合国科技大会上公布两项突破性成果:生成式人工智能应用安全测试标准和大型语言模型安全测试方法。这两项国际标准为人工智能领域的安全评估和测试带来了全新的基准。这些标准由OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等数十家单位的专家学者共同制定。

生成式人工智能应用安全测试标准详细定义了AI应用程序架构每层的测试验证范围,涵盖基础模型选择、嵌入和矢量数据库RAG或检索增强生成AI应用运行时的安全等多个方面。此外,这一标准还针对大型语言模型本身的安全性评估给出了全面、严谨且实操性强的结构性方案,包括安全风险分类、攻击分类分级方法以及具体的测试方法。

大型语言模型安全测试方法旨在为大语言模型本身的安全性评估提供解决方案。该方法可以解决大语言模型固有的复杂性,全面测试其抵御敌对攻击的能力,帮助开发人员和组织识别并缓解潜在漏洞,从而提高使用大语言模型构建的人工智能系统安全性和可靠性。

通过这两项国际标准的制定和实施,人工智能领域将更加重视系统的安全性和可靠性,以满足日益增长的需求和预期。这些标准的发布标志着全球人工智能安全评估和测试进入了新的阶段,有助于推动人工智能的健康发展和广泛应用。

发表回复