#flowchart

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Rishabh Makwana, Mamta, Deeksha Varshney, Oana Cocarascu

该论文提出了 MLingualFC,一个多语言多模态基准测试基准,旨在评估视觉语言模型(VLM)在跨语言场景下通过结构化流程图进行越狱攻击的脆弱性。尽管已有研究表明流程图等结构化视觉提示可以有效地越狱 VLM,但现有研究大多局限于英语环境。为了填补这一空白,该基准将有害指令编码为五种语言(印地语、旁遮普语、西班牙语、罗马尼亚语和德语)的流程图图像,并评估了多个最先进的多语言 VLM(包括 Qwen2.5-VL、Gemma-4 和 Pangea)在黑盒威胁模型下的表现。实验结果表明,存在显著的多语言安全差距:对于拉丁字母语言,基于流程图的攻击成功率达到较高水平,说明有害内容的视觉编码能够有效绕过跨语言的安全对齐;而对于非拉丁字母语言(如旁遮普语),攻击成功率明显更低,这暗示可能是视觉文本识别能力的局限而非更强的安全对齐。这些发现揭示了当前 VLM 安全机制无法跨语言和模态泛化的问题。论文资源已公开。

💡 推荐理由: 该研究揭示了多语言 VLM 在跨语言越狱攻击下的安全脆弱性,对于部署多语言 AI 系统的安全团队具有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)