#sample-wise-targeted

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Phuc Duc Nguyen, Quang Duc Nguyen

本文研究了测试时自适应(Test-time Adaptation, TTA)场景下的一种新型对抗攻击。TTA通过利用无标签测试流来应对分布漂移,但这也为对手提供了可乘之机。现有的类级别定向攻击在TTA中不够隐蔽:由于TTA批量处理,迫使部分样本趋向目标标签会无意中带动相似良性样本,导致目标标签出现频率过高,容易被检测。本文提出一种更真实的样本级定向攻击,攻击者仅使携带特定触发器的样本被错误分类,同时保持良性查询的全局标签分布不变以规避检测。为此,作者设计了一种基于元学习的攻击方法,并引入优先级感知梯度对齐策略,将梯度更新建模为椭球置信域问题,从而缓解攻击成功与分布隐蔽之间的冲突。理论上保证了在梯度不一致的情况下仍能有效优化攻击目标。在CIFAR-10-C、CIFAR-100-C和ImageNet-C数据集上,结合多种TTA协议进行了大量实验,结果表明该方法在保持与无攻击基线一致的标签分布的同时,实现了高定向攻击成功率,在无标签的TTA部署场景中难以被检测。此外,该攻击对现有防御手段表现出强鲁棒性。本文适合从事对抗性机器学习、TTA安全以及鲁棒性评估的研究人员阅读。

💡 推荐理由: TTA作为应对分布漂移的常用技术,其安全性至关重要。本文揭示了更隐蔽的样本级定向攻击,突破了现有防御的检测能力,为TTA的实际部署敲响警钟。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)