#plugin-poisoning

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Jiahao Chen, Xing He, Yong Yang, Xinfeng Li, Chunyi Zhou, Junhao Li, Zhe Ma, Tianyu Du, Shouling Ji

该论文首次系统性地研究了文本到图像(T2I)生态系统中LoRA插件的供应链安全风险。随着T2I模型的普及,基于低秩自适应(LoRA)的插件共享生态(如Civitai、Liblib)蓬勃发展,允许用户轻松定制和分享模型能力。然而,这种开放模式带来了严重的安全隐患:恶意用户可能发布看似无害的LoRA插件,实则隐藏恶意功能,从而污染模型市场。论文提出了PoisonLoRA,首次系统化地探索了LoRA插件的供应链风险,利用T2I生态中的信任和特性,识别出两种主要攻击实例:概念劫持(Concept Hijacking)——劫持后的LoRA可生成影响舆论和宣传的图片;任务注入(Task Injection)——通过秘密密钥激活的LoRA被注入以生成有害内容(如NSFW图片)。关键的是,恶意载荷具有类似病毒的传播能力,通过创作协作(如LoRA合并)进行传播,使每个混合作品成为新的载体。在4个场景的6个数据集上,针对Civitai和Liblib的攻击成功率(ASR)接近100%,且不会被平台检测到。PoisonLoRA表现出极强的鲁棒性,即使迁移到不同基模型或经过5次以上混合,ASR仍接近100%。该研究揭示了T2I生态中隐藏的安全威胁,并呼吁社区关注插件供应链安全。

💡 推荐理由: 随着T2I模型流行,LoRA插件生态的安全风险被严重低估。本文首次系统揭示该威胁,为蓝队和平台安全团队提供了新型攻击面的认知,并为后续防御研究奠定基础。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)