#permission-framework

共收录 1 条相关安全情报。

← 返回所有主题
推荐 5.5
Conf: 50%
👥 作者: Shidong Pan, Xiaoyu Sun, Tianyi Zhang, Dianshu Liao, Meixue Si, Zhenchang Xing

本文提出了一种名为 SkillGuard 的权限框架,旨在解决大型语言模型(LLM)代理技能生态系统中日益严重的安全与隐私问题。随着 LLM 代理通过可重用的技能(包含指令、脚本、工具绑定和上下文依赖)扩展功能,当前技能生态系统主要依赖基于信任的加载和静态检查,导致技能声明的意图与其运行时行为之间存在脱节。SkillGuard 将技能视为具有权限的可执行工件,引入了一种双平面治理模型:一方面通过技能清单、运行时访问控制、用户中介授权、默认拒绝执行、能力推断和行为监控等手段,联合监管技能对代理上下文的影响(context influence)和动作副作用(action side effects)。论文基于 315 个真实世界技能和 SkillInject 数据集进行了评估。结果显示,其权限分类覆盖了 99.76% 的受保护对象,自动清单生成的 F1 值达到 91.0%。在对抗性评估中,SkillGuard 将上下文注入攻击成功率从 32.37% 降至 23.02%,将显式注入攻击成功率从 25.56% 降至 16.67%,同时保持良性任务效用。这些结果表明,SkillGuard 作为技能中心的权限框架,能够为改善代理技能生态系统的隐私和安全性提供实用基础。

💡 推荐理由: LLM 代理技能正快速成为主流扩展方式,但权限缺失导致严重安全隐患。SkillGuard 首次系统性地从技能视角提出完整权限治理方案,对 AI 安全基础设施建设具有重要参考价值。

🎯 建议动作: 研究跟进, 评估将 SkillGuard 设计思想融入内部 Agent 安全方案

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)