#agent

共收录 4 条相关安全情报。

← 返回所有主题
👥 作者: Zhen Xu, Zihao Wang, Yuhua Sun, XiaoFeng Wang

本文针对侧信道分析领域长期存在的挑战——手动分析效率低、依赖预定义目标事件和已知信道、难以规模化——提出了一种名为SCAgent的自动化框架。该框架利用LLM(大型语言模型)驱动的智能体,通过系统探索自动识别敏感事件(如用户或系统行为),避免手动指定;同时,为缓解LLM幻觉,SCAgent基于系统文档进行推理并引入显式验证机制,确保语义一致性、威胁模型可行性和信道可用性。在数据分析方面,采用基于基础模型的少样本学习,避免为每个信道-事件对训练定制模型;并引入时间平移鲁棒的特征提取层,将原始时间序列侧信道信号转换为表格基础模型可处理的形式,从而在有限数据下实现高效分析。作者以iOS系统为实例,重点研究非特权应用可观测的操作系统级侧信道。评估覆盖了标准基准(如前台应用和网站指纹识别)以及新识别出的流行应用中的敏感应用内活动,证明了框架的有效性和可扩展性。

💡 推荐理由: 该研究为侧信道分析提供了自动化、可扩展的解决方案,利用LLM智能体显著降低人工成本,有望提升OS级隐私风险发现效率。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
INFO
PAPER 2026-05-07

Stateful Agent Backdoor

推荐 5.5
Conf: 50%
👥 作者: Zhengchunmin Dai, Jiaxiong Tang, Liantao Wu, Peng Sun, Honglong Chen

该论文提出了一种针对基于大型语言模型(LLM)的智能体的有状态后门攻击方法。现有后门攻击在单个会话内执行固定行为,且攻击状态无法跨会话持久化。作者设计了一种有状态后门,通过持久化组件(如文件系统、数据库等)维护攻击状态,使得在一次触发注入后,攻击能够在多个会话中自主、增量地执行,即使这些会话处于权限隔离环境中。形式上,作者将攻击建模为Mealy机,并推导出分解框架,使得每个状态转换的数据可以独立构建。他们基于此框架实现了一个主要攻击实例和两种扩展变体(不同拓扑结构和持久化组件)。在四个主流LLM模型上的实验表明,主要攻击实例的成功率达到80%–95%,每转换分析验证了分解方法的有效性。扩展变体也展示了一致的效果。该研究揭示了LLM Agent在面对跨会话持久化后门时的脆弱性,对Agent安全防御具有警示意义。适合AI安全研究员、LLM应用开发者阅读。

💡 推荐理由: 该研究揭示了LLM Agent面临的新型持久化后门威胁,突破了传统单会话攻击的局限,对构建鲁棒的Agent安全防护具有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)
👥 作者: Benjamin Probst, Andreas Happe, Jürgen Cito

本文针对本地部署的开源权重大语言模型(LLM)在自动化 Linux 权限提升攻击任务中性能不佳的问题,提出并验证了五种系统级和提示工程的干预方法,以弥补其与云模型(如 GPT-4o)之间的性能差距。研究首先分析了开源模型在自主权限提升中的失败模式,然后设计并实现了链式思考(CoT)、检索增强生成(RAG)、结构提示、历史压缩和反思分析五种干预措施,并将其集成到渗透测试框架 hackingBuddyGPT 中。通过全因子消融实验,在包含多种 Linux 漏洞的测试环境中评估了各干预措施的效果。结果表明,启用干预后,Llama3.1 70B 模型能够利用 83% 的测试漏洞,而较小的模型如 Llama3.1 8B 和 Qwen2.5 7B 在引导下也达到了 67%,均持平甚至超过了 GPT-4o 基线的性能。进一步分析发现,基于反思的干预贡献最大,同时漏洞发现仍是本地模型的瓶颈。该研究为红队自动化渗透测试工具的选型与优化提供了实证依据,表明通过恰当的增强策略,本地模型可以在保证数据隐私的前提下达到接近商业云模型的攻击能力。

💡 推荐理由: 该研究证明本地开源 LLM 通过简单干预即可在权限提升攻击中媲美云模型,为注重数据隐私的组织提供了低成本、高自主性的自动化渗透测试方案,同时揭示了当前本地模型的瓶颈,对红队工具研发和安全评估实践具有直接指导意义。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)