推荐 5.5
Conf: 50%
本文提出SurrogateShield,一种客户端代理机制,旨在解决LLM助手将用户查询明文传输给第三方API端点导致的PII泄露问题。传统的占位符删除方法虽然能抑制PII,但会破坏语义连贯性,导致查询结构退化及响应质量下降。SurrogateShield在传输前,通过三级级联检测流水线(PatternScan、EntityTrace、ContextGuard)识别22种PII类型及基于k-匿名框架的准标识符组合,并用本地生成的类型一致的替代值替换真实PII,随后在响应中恢复原始值。整个过程中,真实PII不跨越网络边界。替代值与原始值的映射存储在AES-256-GCM加密的逐会话ShadowMap中,且永不离开设备。实验基于1,124条查询的语料库,检测流水线总体F1得分达98.87%。语义效用方面,替代替换显著优于占位符删除,BERTScore(roberta-large)从81.59%提升至94.85%,提升13.26个百分点。在100条查询的对抗性试验中,提示LLM敌手无法从替代消息中恢复任何原始值。该方法适合隐私保护要求高的LLM应用场景。
💡 推荐理由: 针对LLM调用第三方API时的PII泄露痛点,提出兼具高效用和强隐私的实用方案,可替代现有占位符删除方法,对构建可信AI服务有重要意义。
🎯 建议动作: 研究跟进
排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)