该论文研究在本地差分隐私(LDP)约束下进行二元假设检验的最优机制设计问题。具体场景是:每个观测数据从大小为 k 的有限字母表中抽取,服从两个已知分布 P0 或 P1 之一,先通过一个 ε-本地差分隐私机制 Q 进行私有化,再基于私有化后的输出推断原始数据来自哪个分布。论文以 f-散度(包括总变差、KL散度、hockey-stick散度等)衡量两个输出分布之间的差异,以此作为检验效用的度量。此前的工作虽然建立了最优机制的结构性质,但仅能给出指数时间复杂度的算法。该论文证明了在任意 ε 和任意 f-散度目标下,将字母表按似然比排序后,存在一个最优机制将排序后的字母表划分为连续块,并对块标签施加随机响应(Randomized Response)。作者将这类机制命名为“排序-划分-随机化(SPR)机制”。基于这一刻画,论文进一步提出了一种精确的动态规划算法,能够在 O(k^3) 时间内计算最优机制,并且通过限制输出数量为 ℓ 可将复杂度降至 O(ℓk^2)。该结果使得在全隐私预算范围内(而非仅渐近隐私体制下)高效计算并刻画精确最优机制成为可能。主要贡献在于:1) 揭示了 LDP 下二元假设检验最优机制的简洁结构;2) 给出了多项式时间算法,解决了此前方法计算代价过高的问题;3) 提供了完整的理论分析和实验验证(尽管摘要未提实验细节)。适合对差分隐私、信息论、统计推断理论感兴趣的研究人员阅读。
💡 推荐理由: 该工作为本地差分隐私下的二元假设检验提供了首个多项式时间最优机制算法,解决了长期存在的理论瓶颈,有助于推动差分隐私在安全检测、A/B测试等场景的实际应用。
🎯 建议动作: 研究跟进