#permission-framework 主题 - Cyber Security Daily Radar

👥 作者: Shidong Pan, Xiaoyu Sun, Tianyi Zhang, Dianshu Liao, Meixue Si, Zhenchang Xing

本文提出了一种名为 SkillGuard 的权限框架，旨在解决大型语言模型（LLM）代理技能生态系统中日益严重的安全与隐私问题。随着 LLM 代理通过可重用的技能（包含指令、脚本、工具绑定和上下文依赖）扩展功能，当前技能生态系统主要依赖基于信任的加载和静态检查，导致技能声明的意图与其运行时行为之间存在脱节。SkillGuard 将技能视为具有权限的可执行工件，引入了一种双平面治理模型：一方面通过技能清单、运行时访问控制、用户中介授权、默认拒绝执行、能力推断和行为监控等手段，联合监管技能对代理上下文的影响（context influence）和动作副作用（action side effects）。论文基于 315 个真实世界技能和 SkillInject 数据集进行了评估。结果显示，其权限分类覆盖了 99.76% 的受保护对象，自动清单生成的 F1 值达到 91.0%。在对抗性评估中，SkillGuard 将上下文注入攻击成功率从 32.37% 降至 23.02%，将显式注入攻击成功率从 25.56% 降至 16.67%，同时保持良性任务效用。这些结果表明，SkillGuard 作为技能中心的权限框架，能够为改善代理技能生态系统的隐私和安全性提供实用基础。

💡 推荐理由: LLM 代理技能正快速成为主流扩展方式，但权限缺失导致严重安全隐患。SkillGuard 首次系统性地从技能视角提出完整权限治理方案，对 AI 安全基础设施建设具有重要参考价值。

🎯 建议动作: 研究跟进, 评估将 SkillGuard 设计思想融入内部 Agent 安全方案

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#permission-framework

SkillGuard: A Permission Framework for Agent Skills