#image-reconstruction 主题 - Cyber Security Daily Radar

👥 作者: Xinjian Luo, Hongyan Chang, Jianxin Wei, Yuncheng Wu, Xiaofeng Gao, Meikang Qiu, Ting Yu, Xue Liu

该论文首次系统研究了分布式多模态大语言模型（MLLM）推理框架中的图像提示重构攻击问题。分布式推理框架通过连接多个消费级设备实现大模型推理，降低了硬件门槛，但近期研究表明，参与节点间传输的中间嵌入会泄露文本提示。随着MLLM的普及，图像提示包含丰富的视觉和语义信息，其中间嵌入更具隐私敏感性，然而针对图像提示的泄露问题尚未被充分探索。本文首先分析了从图像像素到中间表示的信息流，由于图像和文本嵌入在MLLM各层中交织，作者设计了图像嵌入提取算法作为重构攻击的前提，实验表明该算法在几乎所有MLLM层上实现了100%的提取准确率。在此基础上，提出了两种被动黑盒图像重构攻击：MPAA（基于块的像素级重构）和IEDA（基于嵌入引导扩散的语义级重构）。MPAA通过逐块信息提取与组装实现细粒度像素重构，IEDA则利用嵌入引导的扩散生成实现粗粒度语义重构。在Gemma 3、Phi 4 Multimodal、Qwen 2.5 VL和Llama 4 Scout四个代表性MLLM系列上进行了评估，结果显示在不同设置下均有一致的出色重构性能。此外，还分析了MoE架构、图像预处理、模型规模和文本-图像依赖关系对攻击性能的影响。据作者所知，这是首个针对MLLM的图像重构攻击研究，揭示了分布式MLLM推理中图像隐私的严重风险。

💡 推荐理由: 该工作揭示了分布式MLLM推理中图像提示的隐私泄露风险，攻击者可从中间嵌入重构出原始图像，对使用分布式MLLM服务的用户隐私构成威胁。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#image-reconstruction

Image Prompt Reconstruction Attacks on Distributed MLLM Inference Frameworks