推荐 5.5
Conf: 50%
随着模型上下文协议(MCP)在AI代理中的广泛采用,如何确保工具调用通过有意义的用户同意来保障安全成为关键挑战。现有方法要么采用粗粒度的“始终允许”开关,要么依赖不透明的LLM决策,既无法检测危险的调用参数,又容易导致用户同意疲劳。本文提出Conleash——一种客户端中间件,通过风险格(risk lattice)在已知边界内自动允许安全调用并升级风险,结合用户定义不变量的策略引擎,以及将用户决策转化为可复用规则的细化循环,实现边界范围授权的强制执行。在984条真实轨迹上的评估显示,Conleash达到98.2%的准确率,捕获了99.4%的风险升级调用,策略验证仅增加8.2毫秒开销。此外,在N=16的用户研究中,参与者显著偏好Conleash的细粒度权限而非传统方法,认为其更值得信任且减少了提示负担。核心贡献:首次将风险格理论应用于MCP授权,平衡自动化与用户控制;提出了策略引擎与细化循环的协同机制;通过真实数据和用户实验验证了有效性和可用性。
💡 推荐理由: 本文解决了MCP工具调用中用户同意的安全性与可用性矛盾,提供了一种可落地的细粒度授权框架,可显著降低因危险参数调用导致的安全风险,适合AI安全、LLM应用安全研究者及开发MCP中间件的团队关注。
🎯 建议动作: 研究跟进
排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)