#deceptive-patterns

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Zewei Shi, Ruoxi Sun, Haoyang Li, Seong Oun Hwang, Feng Liu, Minhui Xue, Xingliang Yuan

本文针对Web界面中的隐私欺骗模式(Privacy Deceptive Patterns)提出了一种新的威胁模型——AI Grooming,并设计了基于智能体的防御框架DPAgent。隐私欺骗模式通过系统性的设计手法操纵用户泄露个人数据,而现有防御手段分散、静态,且易被大语言模型(LLMs)利用。此外,数据空洞(Data Voids)——即网络生态系统中信息稀缺的区域——为攻击者提供了注入看似良性但实际恶意内容的机会,这些内容会被AI系统抓取和学习,从而放大欺骗性设计和模型异常行为。作者形式化了AI Grooming威胁:攻击者利用数据空洞植入伪装成正常样本的恶意样本,以破坏模型推理并使欺骗性实践正常化。为应对该威胁,DPAgent框架协调四个专有智能体:1)探索智能体:在实时Web环境中主动探索欺骗性UI;2)检测智能体:利用潜在空间净化与防御性提示技术检测欺骗模式;3)修复智能体:自动修复检测到的欺骗界面;4)评估智能体:持续监控防御效果。该框架直接在Web浏览器环境中运行,无需后端修改。实验表明:DPAgent对Groomed样本的检测率达90.98%,在隐私欺骗模式检测任务中取得0.816的微F1分数,达到当前最优;仅访问约10%的基线所需页面即可探索超过80%的模式类型;成功修复77%的检测到的欺骗界面。对485个真实网站的规模研究发现,高达98%的网站包含至少一个隐私欺骗模式,其中超过90%可被DPAgent缓解。用户研究进一步证实DPAgent在保持浏览体验的同时有效降低了隐私风险。本文工作展示了智能体中间人防御在保障Web UI供应链安全、对抗基于数据空洞利用的欺骗性设计与新兴AI威胁方面的潜力。适合安全研究人员、LLM应用开发者以及隐私保护从业者阅读。

💡 推荐理由: 提出了AI Grooming这一新颖威胁模型,揭示了数据空洞与LLM结合的新型攻击面,并给出了首个基于智能体的主动防御框架,对Web UI供应链安全有重要参考价值。

🎯 建议动作: 研究跟进,评估将DPAgent思路集成到现有Web安全检测流水线的可行性。

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)