#plugin-poisoning 主题 - Cyber Security Daily Radar

👥 作者: Jiahao Chen, Xing He, Yong Yang, Xinfeng Li, Chunyi Zhou, Junhao Li, Zhe Ma, Tianyu Du, Shouling Ji

该论文首次系统性地研究了文本到图像（T2I）生态系统中LoRA插件的供应链安全风险。随着T2I模型的普及，基于低秩自适应（LoRA）的插件共享生态（如Civitai、Liblib）蓬勃发展，允许用户轻松定制和分享模型能力。然而，这种开放模式带来了严重的安全隐患：恶意用户可能发布看似无害的LoRA插件，实则隐藏恶意功能，从而污染模型市场。论文提出了PoisonLoRA，首次系统化地探索了LoRA插件的供应链风险，利用T2I生态中的信任和特性，识别出两种主要攻击实例：概念劫持（Concept Hijacking）——劫持后的LoRA可生成影响舆论和宣传的图片；任务注入（Task Injection）——通过秘密密钥激活的LoRA被注入以生成有害内容（如NSFW图片）。关键的是，恶意载荷具有类似病毒的传播能力，通过创作协作（如LoRA合并）进行传播，使每个混合作品成为新的载体。在4个场景的6个数据集上，针对Civitai和Liblib的攻击成功率（ASR）接近100%，且不会被平台检测到。PoisonLoRA表现出极强的鲁棒性，即使迁移到不同基模型或经过5次以上混合，ASR仍接近100%。该研究揭示了T2I生态中隐藏的安全威胁，并呼吁社区关注插件供应链安全。

💡 推荐理由: 随着T2I模型流行，LoRA插件生态的安全风险被严重低估。本文首次系统揭示该威胁，为蓝队和平台安全团队提供了新型攻击面的认知，并为后续防御研究奠定基础。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#plugin-poisoning

Customization under Fire: Plugin Poisoning in Text-to-Image Ecosystem