#agent 主题 - Cyber Security Daily Radar

👥 作者: Yiming Zhang, Jiangrong Wu, Yuhong Nan

该论文针对Android应用隐私与安全审计中数据流分析任务存在的重复分析成本问题，提出了一种基于知识复用的系统性解决方案FlowArk。在批处理模式下，多个代理实例分别处理不同的污点源到汇点的数据流分析任务，但由于代码复用导致不同数据流路径共享相同代码片段，传统方法中相互隔离的代理实例会重复分析这些共享代码，浪费API预算并限制可扩展性。FlowArk通过将已完成分析的历史知识蒸馏为可复用的知识候选，并封装成可匹配的知识条目，在后续代理实例的上下文中注入匹配的知识，从而避免重复分析。实验在50个开源Android应用的4,685个数据流分析任务上评估，基于OpenCode实现。结果表明，FlowArk在保持相似分析质量的同时，将端到端API成本降低26.83%，且在100美元预算下完成的任务数比标准OpenCode多36.66%（1060 vs 776）。该工作为大规模自动化数据流分析的高效部署提供了新思路。

💡 推荐理由: 该研究直接降低了安全分析工具运行成本，提升批量审计效率，有助于实现更广泛、更频繁的Android应用隐私合规检查。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Xingzhi Qian, Xinran Zheng, Yiling He, Lorenzo Cavallaro

该论文提出了一种名为 Malaika 的多智能体框架，用于解决恶意软件理解中的核心挑战：如何在部分可观测性下，从稀疏、分散的代码证据中重建高级恶意行为，并与良性功能区分。作者将恶意软件理解形式化为一个基于证据的推理问题，并主张可靠的行为重建需要三种互补的接地：领域接地（约束假设生成与评估）、语义接地（定位并连接程序证据）、知识接地（通过外部可验证威胁知识支持行为归因）。Malaika 框架通过模拟分析师的推理过程、工具辅助的证据定位和基于检索的行为归因来实现这三种机制，并在 Android 恶意软件分析任务上进行了评估。结果显示，Malaika 在分析质量上优于先前的基于 LLM 的恶意软件分析框架，并表明可靠性不仅依赖于模型能力，还依赖于推理过程。与恶意软件分析系统和前沿智能体框架的对比表明，接地感知推理能产生更精确、可审计的结论。消融研究进一步支持了接地假设。该工作为可靠恶意软件理解提供了原则性基础，并更广泛地适用于基于证据的软件分析。

💡 推荐理由: 该研究为利用 LLM 进行恶意软件分析提供了可解释、可审计的推理框架，有助于分析师高效定位恶意行为证据并形成可信结论，提升自动化分析可靠性。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Nada Lahjouji, Ashwin Gerard Colaco

大型语言模型（LLM）智能体越来越多地用于查询数据库、检索文档集合、调用外部API、记忆过往交互并代表用户执行操作。随着其应用从简单的问答扩展到处理敏感数据，隐私保护变得更加困难。智能体涉及多个数据源、运行多步工作流、跨会话保持状态，并拥有委托权限。因此，敏感信息不仅可能通过最终答案泄露，还可能通过其发出的查询、处理的中间结果、写入的记忆以及与其他智能体交换的消息泄露。本文从数据为中心的角度对LLM智能体的隐私问题进行综述，围绕智能体接触的数据组织研究领域，而非按攻击类型分类，并使用“数据智能体”作为处理数据的LLM智能体的简称。关于这些风险的研究很活跃但分散在检索增强生成、文本到SQL接口、智能体记忆、提示注入、访问控制和上下文隐私等领域。该综述将这些工作整合在一起：对智能体接触的数据源、每个数据源产生的隐私风险以及应对这些风险的治理机制进行了分类；绘制了用于衡量这些风险的基准图并指出了缺失之处；提出了开放问题。两个发现反复出现：在治理机制中，只有信息流控制同时覆盖了组合性推理泄漏和跨会话推理泄漏，这是两个保护最不充分的风险；并且没有基准能在单一隐私策略下驱动智能体跨越其数据表面，这是该领域最缺乏的工具。目标是提供一个可定位分散文献的参考，并为未来工作提供统一的框架。

💡 推荐理由: LLM智能体在数据密集型应用中的隐私风险日益突出，但相关研究分散。本文首次系统性地从数据视角梳理隐私问题，为安全从业者提供了全面的风险分类和治理机制参考。

🎯 建议动作: 阅读并参考其分类框架

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Zhen Xu, Zihao Wang, Yuhua Sun, XiaoFeng Wang

本文针对侧信道分析领域长期存在的挑战——手动分析效率低、依赖预定义目标事件和已知信道、难以规模化——提出了一种名为SCAgent的自动化框架。该框架利用LLM（大型语言模型）驱动的智能体，通过系统探索自动识别敏感事件（如用户或系统行为），避免手动指定；同时，为缓解LLM幻觉，SCAgent基于系统文档进行推理并引入显式验证机制，确保语义一致性、威胁模型可行性和信道可用性。在数据分析方面，采用基于基础模型的少样本学习，避免为每个信道-事件对训练定制模型；并引入时间平移鲁棒的特征提取层，将原始时间序列侧信道信号转换为表格基础模型可处理的形式，从而在有限数据下实现高效分析。作者以iOS系统为实例，重点研究非特权应用可观测的操作系统级侧信道。评估覆盖了标准基准（如前台应用和网站指纹识别）以及新识别出的流行应用中的敏感应用内活动，证明了框架的有效性和可扩展性。

💡 推荐理由: 该研究为侧信道分析提供了自动化、可扩展的解决方案，利用LLM智能体显著降低人工成本，有望提升OS级隐私风险发现效率。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Zhengchunmin Dai, Jiaxiong Tang, Liantao Wu, Peng Sun, Honglong Chen

该论文提出了一种针对基于大型语言模型（LLM）的智能体的有状态后门攻击方法。现有后门攻击在单个会话内执行固定行为，且攻击状态无法跨会话持久化。作者设计了一种有状态后门，通过持久化组件（如文件系统、数据库等）维护攻击状态，使得在一次触发注入后，攻击能够在多个会话中自主、增量地执行，即使这些会话处于权限隔离环境中。形式上，作者将攻击建模为Mealy机，并推导出分解框架，使得每个状态转换的数据可以独立构建。他们基于此框架实现了一个主要攻击实例和两种扩展变体（不同拓扑结构和持久化组件）。在四个主流LLM模型上的实验表明，主要攻击实例的成功率达到80%–95%，每转换分析验证了分解方法的有效性。扩展变体也展示了一致的效果。该研究揭示了LLM Agent在面对跨会话持久化后门时的脆弱性，对Agent安全防御具有警示意义。适合AI安全研究员、LLM应用开发者阅读。

💡 推荐理由: 该研究揭示了LLM Agent面临的新型持久化后门威胁，突破了传统单会话攻击的局限，对构建鲁棒的Agent安全防护具有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

👥 作者: Benjamin Probst, Andreas Happe, Jürgen Cito

本文针对本地部署的开源权重大语言模型（LLM）在自动化 Linux 权限提升攻击任务中性能不佳的问题，提出并验证了五种系统级和提示工程的干预方法，以弥补其与云模型（如 GPT-4o）之间的性能差距。研究首先分析了开源模型在自主权限提升中的失败模式，然后设计并实现了链式思考（CoT）、检索增强生成（RAG）、结构提示、历史压缩和反思分析五种干预措施，并将其集成到渗透测试框架 hackingBuddyGPT 中。通过全因子消融实验，在包含多种 Linux 漏洞的测试环境中评估了各干预措施的效果。结果表明，启用干预后，Llama3.1 70B 模型能够利用 83% 的测试漏洞，而较小的模型如 Llama3.1 8B 和 Qwen2.5 7B 在引导下也达到了 67%，均持平甚至超过了 GPT-4o 基线的性能。进一步分析发现，基于反思的干预贡献最大，同时漏洞发现仍是本地模型的瓶颈。该研究为红队自动化渗透测试工具的选型与优化提供了实证依据，表明通过恰当的增强策略，本地模型可以在保证数据隐私的前提下达到接近商业云模型的攻击能力。

💡 推荐理由: 该研究证明本地开源 LLM 通过简单干预即可在权限提升攻击中媲美云模型，为注重数据隐私的组织提供了低成本、高自主性的自动化渗透测试方案，同时揭示了当前本地模型的瓶颈，对红队工具研发和安全评估实践具有直接指导意义。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

[MOCK] 研究: Rethinking Detection of Prompt Injection in Agentic Systems

💡 推荐理由: 此研究可能为防御侧带来新的建模或检测视角, 建议跟进 abstract 对应方向。

🎯 建议动作: 研究跟进, 评估是否引入到内部防护链。

排序因子: Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#agent

FlowArk: Boosting Agentic Data-flow Analysis for Android Apps via Context-Aware Knowledge Reuse

Malaika: Understanding Malware through Tri-Grounded Agentic Reasoning

Agents That Know Too Much: A Data-Centric Survey of Privacy in LLM Agents

Rethinking Side-Channel Analysis: Automated Discovery and Analysis of Side-Channel Leakage with LLM-Assisted Agents

Stateful Agent Backdoor

Enhancing Linux Privilege Escalation Attack Capabilities of Local LLM Agents

Rethinking Detection of Prompt Injection in Agentic Systems