#image-reconstruction

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Xinjian Luo, Hongyan Chang, Jianxin Wei, Yuncheng Wu, Xiaofeng Gao, Meikang Qiu, Ting Yu, Xue Liu

该论文首次系统研究了分布式多模态大语言模型(MLLM)推理框架中的图像提示重构攻击问题。分布式推理框架通过连接多个消费级设备实现大模型推理,降低了硬件门槛,但近期研究表明,参与节点间传输的中间嵌入会泄露文本提示。随着MLLM的普及,图像提示包含丰富的视觉和语义信息,其中间嵌入更具隐私敏感性,然而针对图像提示的泄露问题尚未被充分探索。本文首先分析了从图像像素到中间表示的信息流,由于图像和文本嵌入在MLLM各层中交织,作者设计了图像嵌入提取算法作为重构攻击的前提,实验表明该算法在几乎所有MLLM层上实现了100%的提取准确率。在此基础上,提出了两种被动黑盒图像重构攻击:MPAA(基于块的像素级重构)和IEDA(基于嵌入引导扩散的语义级重构)。MPAA通过逐块信息提取与组装实现细粒度像素重构,IEDA则利用嵌入引导的扩散生成实现粗粒度语义重构。在Gemma 3、Phi 4 Multimodal、Qwen 2.5 VL和Llama 4 Scout四个代表性MLLM系列上进行了评估,结果显示在不同设置下均有一致的出色重构性能。此外,还分析了MoE架构、图像预处理、模型规模和文本-图像依赖关系对攻击性能的影响。据作者所知,这是首个针对MLLM的图像重构攻击研究,揭示了分布式MLLM推理中图像隐私的严重风险。

💡 推荐理由: 该工作揭示了分布式MLLM推理中图像提示的隐私泄露风险,攻击者可从中间嵌入重构出原始图像,对使用分布式MLLM服务的用户隐私构成威胁。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)