英国发布AI评估工具：Inspect助力模型评价

近日，英国人工智能安全研究所（AI Safety Institute）推出了一款名为“Inspect”的AI模型安全评估平台。该平台采用开源授权方式，向全球AI工程师免费开放，旨在帮助工程师们评估自家模型的性能和安全。

Inspect平台主要由三个主要部分组成：数据集、求解器和评分器。这些部分可以用来评估各种AI模型的特定方面的能力，如模型的核心知识储备量、推理能力和自主能力等。相关框架会根据模型测试结果对各项进行评分。此外，Inspect平台还允许开发者使用Python或其他测试框架作为外挂。

英国AI安全研究所所长Ian Hogarth表示，他们推出Inspect平台的原因是“相信开源的力量”。他表示，该平台能够鼓励更多人参与其中并为改进AI模型作出贡献。同时，它还能提高AI模型的透明度和可重复性，从而降低工程师们的开发成本。