#query-rewriting

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Xinyue Huang, Xiaochun Cao, Wenyuan Yang

本文针对用户向云端LLM发送查询时的隐私泄露问题,提出了一种基于情境完整性(Contextual Integrity, CI)的查询重写方法。现有基于PII类型的脱敏方式忽略上下文,导致两类问题:过度暴露未标注的敏感上下文,或过度移除与回答相关的片段。作者将隐私保护的查询重写重新定义在CI框架下:只有任务必需的字段才应被转发。为此,他们构建了首个任务导向的CI基准测试DelegateCI-Bench,包含3,167个样本,涵盖11个任务和20种任务类型,包括高质量合成数据、基于WildChat的真实用户查询以及一个密集敏感信息的医疗挑战集。在此基础上,他们提出CI引导的强化学习框架,将必需和非必需敏感字段转化为可验证的优化信号,训练查询重写器在保留任务关键信息的同时抑制不必要的敏感披露。实验表明,该学习型重写器在隐私-效用权衡上达到最佳,在设备端基线基础上平均效用提升高达+10.1。该研究为隐私感知的LLM委托提供了新范式。

💡 推荐理由: 随着LLM深度融入工作流,用户查询常混入非必要敏感信息,现有基于类型的脱敏效果不佳。本文提出基于情境完整性的查询重写,为解决隐私与效用矛盾提供了可量化的新思路。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)