#deceptive-patterns 主题 - Cyber Security Daily Radar

👥 作者: Asmit Nayak, Yash Wani, Shirley Zhang 0002, Rishabh Khandelwal, Kassem Fawaz

本文针对数字界面中日益泛滥的欺骗性模式（deceptive patterns）提出了一种自动化检测框架 AutoBot。欺骗性模式利用用户的认知偏差和心理弱点，诱导其做出非本意的决策，常见于各类数字平台，对用户权益构成威胁。现有缓解措施主要来自法律和技术两个角度，但缺乏可用且可扩展的解决方案。AutoBot 的核心创新在于仅凭网站截图即可完成欺骗性模式的识别与定位，无需依赖底层 HTML 代码，这使得其适用于更广泛的现实场景（如难以获取源码的页面或动态渲染内容）。框架采用两阶段流水线：第一阶段利用专门设计的视觉模型分析网站截图，识别交互元素并提取文本特征；第二阶段借助大型语言模型（LLM）理解这些元素的上下文语义，从而判断是否存在欺骗性模式。此外，作者还利用 AutoBot 构建了一个合成数据集，用于将教师大语言模型的知识蒸馏到更小的语言模型中，以降低部署成本并提高推理效率。实验结果表明，AutoBot 在网页欺骗性模式检测任务上取得了 0.93 的 F1 分数，证明了其有效性和实用性。该研究填补了自动化、可扩展检测工具的空白，为 Web 利益相关方（如平台运营者、安全团队、浏览器插件开发者）提供了一种高效缓解在线欺骗性模式的解决方案。读者包括用户界面研究人员、安全分析师、人机交互学者以及关注在线信任与安全的从业者。

💡 推荐理由: 欺骗性模式是用户隐私与决策自主性的重大威胁，但现有检测手段多依赖源码分析，难以覆盖动态网页。AutoBot 展示了纯视觉+LLM 的可行路径，为蓝队和平台安全团队提供了一种不依赖 HTML 的检测思路，可有效发现恶意诱导界面。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自网络安全顶级会议 (+8) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Zewei Shi, Ruoxi Sun, Haoyang Li, Seong Oun Hwang, Feng Liu, Minhui Xue, Xingliang Yuan

本文针对Web界面中的隐私欺骗模式（Privacy Deceptive Patterns）提出了一种新的威胁模型——AI Grooming，并设计了基于智能体的防御框架DPAgent。隐私欺骗模式通过系统性的设计手法操纵用户泄露个人数据，而现有防御手段分散、静态，且易被大语言模型（LLMs）利用。此外，数据空洞（Data Voids）——即网络生态系统中信息稀缺的区域——为攻击者提供了注入看似良性但实际恶意内容的机会，这些内容会被AI系统抓取和学习，从而放大欺骗性设计和模型异常行为。作者形式化了AI Grooming威胁：攻击者利用数据空洞植入伪装成正常样本的恶意样本，以破坏模型推理并使欺骗性实践正常化。为应对该威胁，DPAgent框架协调四个专有智能体：1）探索智能体：在实时Web环境中主动探索欺骗性UI；2）检测智能体：利用潜在空间净化与防御性提示技术检测欺骗模式；3）修复智能体：自动修复检测到的欺骗界面；4）评估智能体：持续监控防御效果。该框架直接在Web浏览器环境中运行，无需后端修改。实验表明：DPAgent对Groomed样本的检测率达90.98%，在隐私欺骗模式检测任务中取得0.816的微F1分数，达到当前最优；仅访问约10%的基线所需页面即可探索超过80%的模式类型；成功修复77%的检测到的欺骗界面。对485个真实网站的规模研究发现，高达98%的网站包含至少一个隐私欺骗模式，其中超过90%可被DPAgent缓解。用户研究进一步证实DPAgent在保持浏览体验的同时有效降低了隐私风险。本文工作展示了智能体中间人防御在保障Web UI供应链安全、对抗基于数据空洞利用的欺骗性设计与新兴AI威胁方面的潜力。适合安全研究人员、LLM应用开发者以及隐私保护从业者阅读。

💡 推荐理由: 提出了AI Grooming这一新颖威胁模型，揭示了数据空洞与LLM结合的新型攻击面，并给出了首个基于智能体的主动防御框架，对Web UI供应链安全有重要参考价值。

🎯 建议动作: 研究跟进，评估将DPAgent思路集成到现有Web安全检测流水线的可行性。

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

Cyber Security Daily Radar

#deceptive-patterns

Automatically Detecting Online Deceptive Patterns.

DPAgent-in-the-Middle: Agentic Defense and Repair Against AI-Groomed Deceptive Patterns