英国发布AI评估工具:Inspect助力模型评价
近日,英国人工智能安全研究所(AI Safety Institute)推出了一款名为“Inspect”的AI模型安全评估平台。该平台采用开源授权方式,向全球AI工程师免费开放,旨在帮助工程师们评估自家模型的性能和安全。
Inspect平台主要由三个主要部分组成:数据集、求解器和评分器。这些部分可以用来评估各种AI模型的特定方面的能力,如模型的核心知识储备量、推理能力和自主能力等。相关框架会根据模型测试结果对各项进行评分。此外,Inspect平台还允许开发者使用Python或其他测试框架作为外挂。
英国AI安全研究所所长Ian Hogarth表示,他们推出Inspect平台的原因是“相信开源的力量”。他表示,该平台能够鼓励更多人参与其中并为改进AI模型作出贡献。同时,它还能提高AI模型的透明度和可重复性,从而降低工程师们的开发成本。