#flowchart 主题 - Cyber Security Daily Radar

👥 作者: Rishabh Makwana, Mamta, Deeksha Varshney, Oana Cocarascu

该论文提出了 MLingualFC，一个多语言多模态基准测试基准，旨在评估视觉语言模型（VLM）在跨语言场景下通过结构化流程图进行越狱攻击的脆弱性。尽管已有研究表明流程图等结构化视觉提示可以有效地越狱 VLM，但现有研究大多局限于英语环境。为了填补这一空白，该基准将有害指令编码为五种语言（印地语、旁遮普语、西班牙语、罗马尼亚语和德语）的流程图图像，并评估了多个最先进的多语言 VLM（包括 Qwen2.5-VL、Gemma-4 和 Pangea）在黑盒威胁模型下的表现。实验结果表明，存在显著的多语言安全差距：对于拉丁字母语言，基于流程图的攻击成功率达到较高水平，说明有害内容的视觉编码能够有效绕过跨语言的安全对齐；而对于非拉丁字母语言（如旁遮普语），攻击成功率明显更低，这暗示可能是视觉文本识别能力的局限而非更强的安全对齐。这些发现揭示了当前 VLM 安全机制无法跨语言和模态泛化的问题。论文资源已公开。

💡 推荐理由: 该研究揭示了多语言 VLM 在跨语言越狱攻击下的安全脆弱性，对于部署多语言 AI 系统的安全团队具有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#flowchart

MLingualFC: Evaluating Jailbreak Vulnerabilities in Multilingual Vision-Language Models