#gaussian-process 主题 - Cyber Security Daily Radar

👥 作者: Ismi Abidi, Ishan Nangia, Paarijaat Aditya, Rijurekha Sen

该论文聚焦于城市感知中的隐私保护问题，以空气污染监测为用例。研究背景是：提供网约车、电商物流、外卖配送等服务的公司愿意为车辆安装传感器，以大规模采集交通拥堵、行程时间、路面质量、空气质量等数据。然而，这些细粒度传感器数据会暴露部署车队的车辆位置和数量，这对同领域竞争对手（如Uber vs Ola、Amazon vs Alibaba）具有高度商业价值。为解决此问题，论文提出一种结合高斯过程回归（GPR）插值、差分隐私（DP）和安全两方计算（2PC）的隐私保护方案。该方案在保留用户效用（如查询最不污染的路线）的同时，确保车队位置隐私和客户端隐私不被泄露。系统在延迟和带宽开销上高效，甚至适用于资源受限的移动客户端。为演示端到端系统，作者构建了一个示例Android应用，可在隐私保护前提下为给定起止点提供污染最少的路线选项。论文的主要贡献在于：将GPR、DP和2PC三种技术结合，实现可扩展的、保护隐私的城市感知数据共享机制，并验证了其在实际移动设备上的可行性。适合关注数据隐私、安全多方计算、差分隐私以及智慧城市应用的研究人员和工程师阅读。

💡 推荐理由: 该研究为车队感知数据的隐私保护提供了实用的技术方案，对于平衡数据利用与商业机密保护有重要意义，可推广至交通、物流等领域的隐私合规需求。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

👥 作者: Tomasz Maciazek

本文研究了在高斯过程（GP）后验采样中释放样本路径的隐私保护问题，其中整个训练集（包括协变量和响应）被视为私密信息。与传统差分隐私（DP）机制通过添加外部噪声不同，后验采样本身具有随机性。作者证明这种内在随机性能够提供差分隐私保证，具体通过推导高斯过程后验样本路径释放的显式 Rényi-DP 界。这些界将后验均值泄露与数据相关的后验协方差泄露分离，表明有意义的隐私保护强烈依赖于有效的岭正则化。通过成员推理攻击实验，作者展示了经验泄露与正则化、后验方差以及释放的后验样本路径数量之间的预测依赖关系。下游后验采样任务上的效用实验识别出噪声观测场景，在该场景下隐私兼容的正则化以适度的效用损失保留了有用的决策。当需要更强隐私保护时，可通过添加校准的 GP 噪声来增强内在保证，从而提供显式的额外隐私调节旋钮。该研究为理解 GP 后验采样的隐私属性提供了理论基础。

💡 推荐理由: 本文为高斯过程后验采样的内在隐私保证提供了理论依据，可帮助安全从业者评估使用 GP 模型时泄露训练数据的风险，并指导选择正则化参数以平衡隐私与效用。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Junfeng Guo Heng Huang

强化学习（RL）在现实世界中的应用日益广泛，但其安全性问题仍需更多关注。最新研究表明，RL智能体容易受到后门攻击的影响：当特定触发器被激活时，本应行为正常的智能体会执行恶意动作。现有的RL后门防御方法要么需要访问智能体的内部参数，要么仅在模型或轨迹级别运行，或者仅限于特定攻击类型。本文提出了一种名为PolicyGuard的新型防御机制，该机制在测试时、步骤级别进行后门检测。PolicyGuard利用高斯过程（GP）后验方差，并通过生成伪轨迹来计算每个时间步的不确定性，从而识别异常行为。此外，作者提供了理论依据来解释GP后验方差的有效性。在七个RL游戏环境中进行了大量实验，结果表明PolicyGuard在大多数情况下达到了最先进的检测性能：对于基于扰动的攻击，平均AUROC为0.856；对于对抗性智能体攻击，平均AUROC为0.859。本文的主要贡献包括：首次提出测试时、步骤级别的后门防御方法；利用GP后验方差实现细粒度不确定性量化；提供了理论支撑；以及通过广泛实验验证了方法的有效性。适合强化学习安全研究员、AI安全工程师以及对抗机器学习方向的研究者阅读。

💡 推荐理由: 强化学习后门攻击威胁严重，但现有防御存在短板。PolicyGuard首次实现测试时步骤级检测，无需修改训练过程或访问内部参数，为RL安全提供了实用且高效的防护方案。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#gaussian-process

Privacy in Urban Sensing with Instrumented Fleets, Using Air Pollution Monitoring As A Usecase.

Differential Privacy of Gaussian Process Posterior Sampling

PolicyGuard: Towards Test-time and Step-level Adversary Defense for Reinforcement Learning Agent