#cs.MM

共收录 9 条相关安全情报。

← 返回所有主题
👥 作者: Zihao Wang, Yiming Li, Yutong Wu, Zheyu Liu, Kangjie Chen, Fok Kar Wai, Pin-Yu Chen, Vrizlynn L. L. Thing, Bo Li, Dacheng Tao, Tianwei Zhang

大型语言模型驱动的Web代理(Web Agent)正越来越多地被部署在真实环境中,它们需要处理不可信的网页内容并执行具有直接后果的操作,因此容易受到提示注入攻击——看似良性的内容中嵌入对抗性指令以操纵代理行为。现有的安全基准采用“攻击中心”视角,仅关注注入的技术可行性,而忽略了危害在不同利益相关者之间的不对称分布。实际上,同一次攻击可能对用户、卖家、平台等不同实体产生截然不同的后果,且同一攻击模式对不同目标的有效性也可能显著不同。为捕捉这些特性,本文提出**SBC**(Stakeholder-Centric Benchmark),一个以利益相关者为中心的基准,系统性地对真实Web代理系统中的危害进行分类和归因。SBC区分受影响的实体(如用户、卖家、平台),将攻击分解为具体目标(如信息窃取、任务劫持、信誉损害等),并采用互补的结果级和过程级度量进行评估。实验结果显示,当前的主流代理无法可靠地抵御任何单一攻击目标,且失败模式呈现多样化的定性差异:包括“隐蔽寄生”(攻击成功但不干扰用户委托任务)、“错位干扰”(任务被中断但攻击未成功)和“复合失败”(对抗目标与任务完整性同时被违反)。这些模式在传统评估中被完全忽略。本文的工作强调了在真实部署中采用利益相关者感知评估的必要性,为LLM基代理的安全性研究提供了新的视角和工具。该基准已开源(https://github.com/StakeBench/SBC)。

💡 推荐理由: 该研究揭示了提示注入攻击对Web代理不同利益相关者的影响差异,提供了一个结构化的危害归因框架。安全从业者可借此评估自身系统在复杂多角色场景下的真实风险,避免传统单维度评估的盲区,从而设计更有针对性的防御策略。

🎯 建议动作: 研究跟进:阅读论文并下载基准框架,评估自身Web代理系统在用户、卖家、平台等不同视角下的提示注入脆弱性,重点关注隐蔽寄生和错位干扰等非传统失败模式。

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Haiyun Li, Shuhai Peng, Zhisheng Zhang, Jingran Xie, Xiaofeng Xie, Hanyang Peng, Zhiyong Wu

本文提出一种特征对齐的语音水印方法,旨在提高水印对语音重建模型(如现有或未知的编解码器)的鲁棒性。传统音频水印在保真度与鲁棒性之间存在权衡:增加水印能量可提升鲁棒性,但会降低不可感知性。作者利用预训练语音编解码器生成伪语音水印,使其分布与原始语音特征对齐,从而允许嵌入更高能量的水印而不影响感知质量。具体地,将伪水印融合到输入音频的语谱图中,并通过VAD损失和感知损失引导水印仅嵌入在有声区域。实验表明,该方法在保持与现有技术相当不可感知性的同时,在已知和未知语音重建模型下均显著提升了鲁棒性。该研究适用于对抗深度伪造语音溯源、版权保护等场景。

💡 推荐理由: 为音频水印的实用化提供新思路,可抵抗语音重编码攻击,对深度伪造检测与溯源有直接帮助。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Leyi Qi, Yiming Li, Siyuan Liang, Zhengzhong Tu, Dacheng Tao

随着文本到图像(T2I)扩散模型在创意应用中的广泛使用,模型被未经授权使用的问题日益严重,模型所有权验证(MOV)成为保护知识产权的重要手段。现有基于后门的扩散模型水印方法通常隐含假设验证过程是“忠实”的,即验证者可以查询可疑模型并获得可信的水印响应。然而,在实际对抗环境中,攻击者可能有意或无意地破坏水印信号,导致验证可靠性显著下降。针对这一问题,本文提出了 Cert-LAS,这是首个基于层自适应平滑的认证 T2I 模型所有权验证方法。具体而言,Cert-LAS 利用扩散分类器和拉普拉斯频率敏感(LFS)引导的层自适应噪声将指定水印嵌入模型,并通过假设检验验证可疑模型是否表现出比未加水印参考模型显著更强的水印响应。理论上,作者证明了在特定条件下,即使存在恶意移除攻击,Cert-LAS 仍能实现可靠验证。大量实验验证了 Cert-LAS 的有效性及其对自适应攻击的抵抗性。该工作为 T2I 扩散模型的版权保护提供了具有认证保障的解决方案。

💡 推荐理由: 本文首次为 T2I 扩散模型提供了具有认证保障的所有权验证方法,能有效抵抗恶意水印移除攻击,对保护模型知识产权具有重要实用价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Zongheng Cao, Yi Zheng, Rui Song, Xinyu Hu

本文提出了 AgenticVBench,一个用于评估多模态 AI 智能体在真实世界视频后期制作任务中表现的全新基准。视频制作工作流需要智能体具备文本、图像、音频、视频的综合理解能力,以及长期规划和工具使用能力。该基准包含来自 20 位平均 6 年行业经验的专家贡献的实时制作工作流,涵盖 4 个任务家族共 100 个智能体任务,并配有结合程序化验证器和专家评分标准的评估规范。研究评估了前沿视觉语言模型(VLM),使用了厂商原生和开源工具链。最佳评估的智能体堆栈仅勉强超过 30% 的成功率,远低于人类专家在同一任务上的表现。进一步发现,工具链的选择会显著影响模型行为,包括得分、工具使用模式和失败模式。AgenticVBench 为诊断和改进用于智能体视频制作的模型及工具链提供了基础。适合对多模态 AI 智能体、视频自动化和基准设计感兴趣的研究人员阅读。

💡 推荐理由: 视频后期制作是 AI 智能体落地的高价值场景,该基准首次系统化评估了多模态智能体的复合能力,揭示了当前前沿模型与实际部署的巨大差距,对推动 AI 在影视制作领域的应用有重要参考意义。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Ching-Chun Chang, Isao Echizen

该论文类比生物学中的物种起源,探讨了合成信息(如AI生成内容)的溯源问题。核心挑战在于:当代AI模型生成的“后代”数据可能在结构和信号层面与原始来源差异巨大,导致进化谱系难以追踪。受遗传学启发,作者提出一种基于隐写术的谱系追踪机制:在合成信息被生成(即“繁殖”)时,投影器从父本中提取一个特征(trait),并通过隐写编码器将该特征不可见地嵌入到子本中;该特征在子本的生命周期内持续存在。当需要查询亲子关系时,隐写解码器从子本中提取特征,并与候选父本的特征池进行比对,从而判定最可能的来源。理论分析刻画了系统参数(投影器与隐写系统属性)对系统发育准确性的影响,而跨多种投影器和隐写系统的实验表明,该方法在一系列处理操作和语义修改下仍具有可行性。作者展望了一个合成信息均携带隐蔽但可追踪谱系特征的网络生态系统,从而能够追溯信息的演化历程。

💡 推荐理由: 本文提供了一种新颖的合成内容溯源方法,可应对AI生成内容被广泛误用或伪造的风险。通过隐写术嵌入谱系特征,有助于鉴别内容来源、提升信息可信度,并为内容真实性验证提供技术基础。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)
👥 作者: Yifei Zhou, Xianjun Gu, Xinyu Dai, Ming Liu, Lansheng Han

本文提出了一种名为PEMark的API响应水印方案,旨在解决API数据泄露后的溯源问题。现有水印技术通常需要修改数据库或API响应数据,这会迫使业务系统代码变更,甚至因数据值改变而影响正常业务。作者创新性地利用JSON/XML键值对顺序中固有的排列冗余——这一被忽视的维度不携带语义信息,但提供了丰富的编码容量。方案包含两个核心组件:水印代理网关和基于位置编码的水印嵌入。首先,服务器响应被转发至水印代理网关,该设计无需对现有业务系统进行任何修改;然后,通过位置编码对键值对进行重新排序来嵌入水印,而不改变任何数据值。据作者所知,这是首个通过代理网关上的位置编码实现无损API响应水印的工作。实验结果显示,该框架在保持业务可用性的同时,确保返回的API数据可追溯。与当前主流方案相比,该方法对篡改和插入攻击具有鲁棒性(100%相似度),并能抵御一定程度的删除攻击。论文主要贡献包括:零业务代码修改、零数据值修改、高鲁棒性、以及首创性的位置编码水印方法。适合关注API安全、数据泄露防护、水印技术的研究人员和工程师阅读。

💡 推荐理由: 提出了一种无需修改业务代码和数据值的API水印方案,解决了现有方案影响业务运行的核心痛点,为API数据泄漏溯源提供了实用且低侵入性的解决思路。

🎯 建议动作: 研究跟进,评估将代理网关水印方案集成到内部API网关的可行性与性能影响。

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Gustav Olaf Yunus Laitinen-Fredriksson Lundström-Imanov, Nurana Abdullayeva

本文提出一个统一的证据框架,将密码学内容来源、鲁棒统计水印和零知识证明映射到三个法律体系(国际军事行动法、国内诉讼程序、产品监管)的证明要求中。该框架定义了一个五级威胁模型,涵盖从朴素再生、对抗性清洗、跨模型再生、主动水印移除到内部来源伪造。作者发布了包含12000个生成项(涵盖图像、音频、视频模态)的公开基准,并经过六种清洗管道处理,得到72000个评估样本。他们对四种代表性方案进行了评估,报告了在固定假阳性率下的真阳性率、鲁棒性曲线下面积、计算开销以及针对不同法律体系的条件法律充分性评分。最终将实证检测边界转化为法律充分性阈值,用于武装冲突法中的指挥决策、国内刑事和民事程序中的可采性,以及欧盟人工智能法案下的持久性审计。该成果提供了一个可复现的参考管道、公共基准和模型附件,可供律师、工程师和操作人员共同部署。

💡 推荐理由: 本文首次将AI生成内容的可验证来源与水印技术系统性地映射到法律证据要求,为安全从业者提供了跨学科的技术-法律评估基准,有助于在合规场景中设计可辩护的防御方案。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Aida Koch, Logan Lewis, Lily Scott, Agi Weber

本文提出将集合塑造理论(Set Shaping Theory, SST)作为一种可逆的载荷整形层,用于基于最低有效位(LSB)的图像隐写术。该方法并非要取代现有的隐写嵌入方案,而是作为一个预处理阶段,使现有嵌入方法更容易应用且引入更低的统计扰动。SST变换通过增加K个符号来延长消息长度,并采用Glen Tankersley开发的快速近似变换算法实现。尽管嵌入载荷从N位增加到N+K位,但所选择的表示可以降低KL散度(D_KL(P||Q)),从而在基于直方图的检测标准下使后续的隐写插入更难被检测。在四种合成覆盖图像模型上的1800次受控模拟中,相对于公平的N+K LSB基线,SST平均将KL散度降低了25.16%,95%置信区间为±1.22%。当K=8时,平均降低达到42.81%。使用密钥随机嵌入路径的额外鲁棒性模拟证实了该效果在多种距离度量上的表现:K=8时,KL散度降低42.44%,Jensen-Shannon散度降低29.62%,总变差降低12.41%,对称卡方距离降低28.30%。此外,基于图像的矩阵嵌入/STC类模拟显示,SST还降低了最小加权插入成本:相对于未整形的K=0参考,K=8使成本降低了6.93%。

💡 推荐理由: 该研究提出了一种新颖的预处理方法,可显著降低隐写操作的统计可检测性,对防御方设计更鲁棒的隐写检测算法具有启发意义。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Shiladitya Bhattacharjee, Subha Bhattacharya, Arnab Chatterjee, Sulabh Bansal, Saurabh Shukla

该论文提出了一种针对大视频文件的同时压缩与加密系统(SDCE),旨在解决传统压缩和加密方法计算开销大、处理时间长、不适合实时应用的问题。核心方法是将基于混沌映射的加密与霍夫曼无损编码压缩整合到一个统一框架中:利用逻辑映射生成伪随机混沌序列用于XOR加密,确保强安全性;同时采用霍夫曼编码进行无损压缩,显著降低计算开销和处理时间。实验结果显示,与现有方法相比,该系统在熵值、雪崩效应、吞吐量、压缩比、峰值信噪比(PSNR)、每速率位数(BPC)以及数据损失百分比等指标上均表现出更优性能,有效增强数据隐私和完整性。该研究适用于需要高安全性和实时性的大视频文件传输场景。

💡 推荐理由: 为大规模视频传输提供了一种兼顾高安全性与低延迟的解决方案,尤其适用于视频监控、流媒体、远程医疗等对实时性和数据保护要求高的场景。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)