#hypothesis-testing 主题 - Cyber Security Daily Radar

👥 作者: Elena Ghazi, Jawad Nasser, Flavio Calmon, Ibrahim Issa

该论文研究在本地差分隐私（LDP）约束下进行二元假设检验的最优机制设计问题。具体场景是：每个观测数据从大小为 k 的有限字母表中抽取，服从两个已知分布 P0 或 P1 之一，先通过一个 ε-本地差分隐私机制 Q 进行私有化，再基于私有化后的输出推断原始数据来自哪个分布。论文以 f-散度（包括总变差、KL散度、hockey-stick散度等）衡量两个输出分布之间的差异，以此作为检验效用的度量。此前的工作虽然建立了最优机制的结构性质，但仅能给出指数时间复杂度的算法。该论文证明了在任意 ε 和任意 f-散度目标下，将字母表按似然比排序后，存在一个最优机制将排序后的字母表划分为连续块，并对块标签施加随机响应（Randomized Response）。作者将这类机制命名为“排序-划分-随机化（SPR）机制”。基于这一刻画，论文进一步提出了一种精确的动态规划算法，能够在 O(k^3) 时间内计算最优机制，并且通过限制输出数量为 ℓ 可将复杂度降至 O(ℓk^2)。该结果使得在全隐私预算范围内（而非仅渐近隐私体制下）高效计算并刻画精确最优机制成为可能。主要贡献在于：1) 揭示了 LDP 下二元假设检验最优机制的简洁结构；2) 给出了多项式时间算法，解决了此前方法计算代价过高的问题；3) 提供了完整的理论分析和实验验证（尽管摘要未提实验细节）。适合对差分隐私、信息论、统计推断理论感兴趣的研究人员阅读。

💡 推荐理由: 该工作为本地差分隐私下的二元假设检验提供了首个多项式时间最优机制算法，解决了长期存在的理论瓶颈，有助于推动差分隐私在安全检测、A/B测试等场景的实际应用。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Ben Jacobsen, Tomas Gonzales, Gavin Brown, Kassem Fawaz, Aaditya Ramdas

该论文研究了在差分隐私约束下，使用e值进行假设检验时的最优速率问题。E值作为一种灵活的工具，近年来在允许任意有效和自适应数据分析中受到广泛关注，其应用常涉及隐私或敏感数据。作者提出了一个核心问题：给定两个分布P和Q，在满足ε-差分隐私的e值检验中，最大化e-power（即检验功效）的最优速率是多少？论文给出了该问题的特征描述，并提出了一个达到最优速率的算法。在序列设置中，当观测值逐个到达且分析师选择何时停止时，作者给出了任何私有e-process的停止时间的匹配上下界。数值实验证实了算法的实用性，在多种序列测试问题和隐私水平下，该算法所需的数据量少于近期提出的DP-SPRT方法。本研究为差分隐私假设检验提供了理论最优性和实用算法，适用于需要隐私保护的统计推断场景。

💡 推荐理由: 该研究为差分隐私下的假设检验提供了理论最优解和实用算法，有助于在保护数据隐私的同时进行高效可靠的统计推断，对联邦学习、机密数据分析等安全敏感场景有重要指导意义。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#hypothesis-testing

Sort, Partition, Randomize: Optimal Binary Hypothesis Testing under Local Differential Privacy

Optimal Rates for Differentially Private Hypothesis Testing with E-values