9月28日,IT之家获悉,苏黎世联邦理工学院的博士生Andreas Plesner及其研究团队发布了一项最新研究成果。这项研究聚焦于谷歌的验证码系统reCAPTCHA V2,并揭露了一个令人关注的发现:经过特定训练的图像识别模型在应对这类图片验证码时,其表现已经能够与人类相媲美,识别成功率高达100%。
值得注意的是,谷歌的reCAPTCHA V2验证码系统通常要求用户识别图片中的特定元素,如自行车、巴士、人行道、楼梯或红绿灯等。尽管谷歌表示该系统已在几年前逐步淘汰,转而采用新的reCAPTCHA v3版本,但仍有数百万个网站仍在使用v2系统。
研究团队利用经过微调的开源YOLO(You Only Look Once,你只看一次)对象识别模型,该模型以实时检测对象的能力而著称,且能在计算资源有限的设备上运行。在训练14000张标记的交通图像后,该模型能够识别出任何验证码网格图像属于reCAPTCHA v2的13个候选类别之一。
为了应对所谓的“类型2”挑战,即要求用户识别单张分割图像的哪些部分包含特定类型的对象(仅适用于13个对象类别中的9个类别),研究团队还使用了一个预先训练好的YOLO模型。即便在遇到剩余的4个类别时,系统也仅需提供一张新图像。
除了图像识别模型,研究团队还采取了一系列措施来规避ReCAPTCHA系统的检测,例如避免来自同一IP地址的重复尝试。根据识别对象的类型,YOLO模型识别单个验证码图像的准确率从69%(摩托车)到100%(消防栓)不等。这些性能加上其他预防措施,使得机器人能够每次成功“攻克”验证码。
实际上,在类似的测试中,机器人解决CAPTCHA的挑战次数略少于人类,尽管这种进步在统计学上并不显著。此前,类似的研究在成功率达到68%到71%之间。这项研究的作者表示,成功率达到100%标志着“超越验证码”的时代已经到来。
相关论文的详细信息可访问[2409.08831] Breaking reCAPTCHAv2(arxiv.org)。