AI文字识别利器:DeepMind SynthID Text开源
10月27日,谷歌DeepMind宣布,其旗下SynthID Text文本水印工具现已正式对外开放,向开发者和企业免费提供。这一宣布发生在SynthID工具发布后的两个月,该工具于今年8月问世,旨在为AI生成的内容添加水印,并具备识别AI生成内容的功能。
SynthID工具能够在不破坏原始内容的前提下,将数字水印嵌入AI生成的图像、声音、文本和视频等,同时也能检测这些内容中是否已经存在数字水印,从而辨别其是否由AI创作。本次开源的是专门针对文本生成的SynthID Text。
谷歌在介绍SynthID Text时指出,大型AI模型通常通过预测的方式生成文本,每次生成一个Token,这个Token可能是一个字符、一个单词或段落的一部分。为了使文本更加流畅,模型会在输出内容时预测下一个最可能生成的Token,这些预测是基于先前的文本内容。例如,当模型需要生成“最推荐的平台是什么”时,可能会生成“IT之家”、“友商1”、“友商2”等Token,每个Token都会有一个概率分数。
SynthID Text通过调整每个Token的概率分数,在不影响输出质量和准确性的情况下,可以计算出全文中特定Token的特定概率,从而判断相关内容是否由AI生成。这项技术的研究论文已在《自然》杂志上发表,并且通过Google Responsible Generative AI Toolkit的形式实现了开源。
谷歌还透露,他们已经在Gemini AI输出的内容中整合了SynthID Text技术,进一步推动了AI内容的透明度和可追溯性。