#knowledge-corruption 主题 - Cyber Security Daily Radar

👥 作者: Yanting Wang, Chenlong Yin, Ying Chen, Jinyuan Jia

该论文提出 FlashRT，首个针对长上下文大语言模型（如 Gemini-3.1-Pro 和 Qwen-3.5）中提示注入和知识破坏攻击的优化红队框架。现有基于优化的红队方法虽然攻击效果好，但计算和内存开销巨大，尤其对于长上下文场景（如 32K token 的上下文需要 264 GB GPU 内存），阻碍了社区尤其是学术研究者对 LLM 安全风险的系统评估。FlashRT 通过设计高效的梯度计算和内存管理策略，显著降低资源消耗。实验表明，与基线 nanoGCG 相比，FlashRT 实现 2x-7x 的加速（例如将运行时从一小时降至十分钟以内）和 2x-4x 的 GPU 内存降低（例如将 32K token 上下文的 GPU 内存从 264.1 GB 降至 65.7 GB）。该框架可泛化应用于其他黑盒优化方法（如 TAP 和 AutoDAN）。论文开源了代码（https://github.com/Wang-Yanting/FlashRT），旨在为社区提供高效的红队工具，支持系统化评估长上下文 LLM 的安全性。适合 LLM 安全研究者、红队测试工程师及关注 LLM 对齐与防御的从业人员阅读。

💡 推荐理由: 长上下文 LLM 安全评估因高昂计算成本而受限，FlashRT 大幅降低门槛，使学术界和中小团队也能进行系统化红队测试，推动 LLM 安全研究普及。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#knowledge-corruption

FlashRT: Towards Computationally and Memory Efficient Red-Teaming for Prompt Injection and Knowledge Corruption