#captcha 主题 - Cyber Security Daily Radar

👥 作者: Behzad Ousat, Nikita Turkmen, Lalchandra Rampersaud, Dillan Bailey, Amin Kharraz

本文针对基于LLM的浏览器代理对现有Web机器人防御系统的有效性进行了系统性评估。随着LLM代理能够自主导航网页、理解页面内容并通过自然语言指令与界面交互，传统的自动化框架（如Selenium）所面临的挑战被进一步放大。作者对比了两种防御类型：交互式挑战类防御（如hCaptcha、reCAPTCHA v2、Cloudflare Turnstile）和非交互式信任类防御（如reCAPTCHA v3）。实验涉及7种商业验证码破解服务和6种LLM代理（包括云托管、自托管、AI辅助和浏览器扩展配置）。结果显示，交互式防御对商业破解服务几乎无效（接近100%绕过且成本极低），而LLM代理在配备专用破解模块时也能有效绕过。非交互式防御（如reCAPTCHA v3）表现出更强的抵抗力，但通过细粒度交互轨迹分析发现，这种抵抗力并非源于安全性的根本提升——具有几乎相同行为足迹的两个代理产生截然不同的结果（一个绕过，一个失败），表明决定因素是执行环境的真实性而非代理行为。这一发现揭示了非交互式防御的安全边界位于环境层，对机器人管理系统的设计和评估具有重要启示。

💡 推荐理由: LLM代理正重塑网络威胁格局，本研究首次系统评估了其对主流机器人防御（验证码等）的实际绕过能力，揭示现有防御体系的根本脆弱性，迫使安全社区重新审视基于行为检测或挑战的防线。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Md Neyamul Islam Shibbir, Md Hasibur Rahman, Farida Chowdhury, Md Sadek Ferdous

该论文提出并实现了一种基于孟加拉语的文本验证码（CAPTCHA）机制，旨在解决传统英语验证码对非英语母语用户存在的可用性问题。这是首个针对孟加拉语用户的文本验证码方案。作者设计了6种变体，并通过6000个挑战（每种变体约1000个）进行自动化OCR攻击测试，平均字符识别率仅为0-20%，表明其具有较强的安全性。同时，通过110名参与者的用户可用性评估，6种变体的成功率为56.25%至90.29%，平均响应时间为6.69至9.9秒，在文本验证码基准中表现突出。论文详细阐述了设计原理、实现细节以及实验结果，证明了该方案在安全性和可用性之间的良好平衡。研究为区域语言用户提供了更友好的安全防护手段，并为未来多语言验证码设计提供了参考。

💡 推荐理由: 该研究解决了非英语用户（特别是孟加拉语使用者）在验证码可用性上的痛点，同时维持了较强的抗OCR攻击能力，为提升全球网络安全包容性提供了新思路。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Ruijie Zhao 0001, Xianwen Deng, Yanhao Wang, Zhicong Yan, Zhengguang Han, Libo Chen 0001, Zhi Xue, Yijun Wang

文本验证码（text-based captcha）作为一种区分人类用户与机器人的安全机制，虽然已面临多种攻击方法，但仍被广泛使用。近年来，基于深度学习的验证码破解器取得了显著效果，但其高度依赖大量人工标注数据，成本高昂且耗时。此前的一些工作试图通过有限的标注数据集构建易用的破解器，但受限于低效的预处理流程以及对具有复杂安全特性的验证码的识别能力不足。本文提出了一种名为 GeeSolver 的通用、高效且省力的文本验证码破解器，其核心思想是：许多难以攻破的验证码方案通过“破坏”标准字体来增加难度，这种破坏类似于图像中的遮挡（mask）。受此启发，作者利用掩码自编码器（Masked Autoencoder, MAE）架构，让模型从验证码图像中未被遮挡的部分学习潜在表示，从而推断出对应的字符。具体而言，GeeSolver 包含一个 ViT（Vision Transformer）编码器作为潜在表示提取器，以及一个精心设计的解码器用于验证码识别。编码器通过 MAE 范式进行预训练，使其能够仅从局部信息（即未被遮挡的部分）提取出足以推断字符的潜在表示。随后，编码器参数被冻结，利用少量标注验证码和大量未标注验证码，通过半监督学习训练解码器。实验在真实世界的验证码方案上进行，结果表明：GeeSolver 在使用少量标注数据的情况下，大幅超越了当前最先进的方法；同时，它效率极高，使用桌面级 CPU 可在 25 毫秒内破解一个验证码，使用 GPU 仅需 9 毫秒。此外，得益于潜在表示提取能力，GeeSolver 成功破解了先前难以攻击的验证码方案，证明了其通用性。作者希望这项工作能帮助安全专家重新审视文本验证码的设计与可用性。代码已开源。

💡 推荐理由: 该研究展示了自监督学习显著降低了文本验证码破解的门槛，即使只有少量标注数据也能高效攻击复杂验证码，迫使安全从业者重新评估验证码的安全性。

🎯 建议动作: 研究跟进，验证码设计者需评估新型自监督学习方法对自身方案的影响，考虑引入行为验证、多模态验证或更复杂的图灵测试。

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#captcha

Broken Gates: Re-evaluating Web Bot Defenses in the Age of LLM Agents

A Usable and Secure Bengali CAPTCHA

GeeSolver: A Generic, Efficient, and Effortless Solver with Self-Supervised Learning for Breaking Text Captchas.