Arctic embed:Snowflake 开源全球实用检索文本嵌入AI模型

近日,Snowflake公司发布了一项重大突破性成果,在Apache 2.0许可下,成功推出了开源Arctic embed系列模型。这一系列模型凭借其在衡量文本嵌入模型的评估指标合集(MTEB)检索排行榜上的出色表现,成为了同类模型中的佼佼者。据最新数据显示,Arctic embed系列最大模型参数仅为3.34亿个,而其平均检索性能更是超过了55.9,成为唯一一个在该指标上超过55.9的模型。

这些模型在各种规模的数据中都能提供最先进的检索结果,表现优于其他开源模型。同时,它们还具有较高的性能和效率,大型型号的参数比封闭源型号高出4倍,能在较小的占地面积上实现卓越的性能。此外,该系列模型还特别适用于长文档的处理,其中中型(m)模式包含了一个专门针对长文本设计的版本,能够轻松应对扩展文档(最多8192个标记)的需求。

值得一提的是,Arctic embed系列模型在企业优化方面也具有明显优势。与同类产品相比,Arctic的嵌入式机型具有更低的延迟和更低的总拥有成本(TCO),这无疑为企业节省了大量时间和资金。

总之,Snowflake公司通过推出Arctic embed系列模型,再次展示了其在人工智能领域的创新实力,为广大用户带来了更高的性能和更高效能的解决方案。

发表回复