#sketching

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Benjamin Coleman, Anshumali Shrivastava

本文针对大规模机器学习场景下的差分隐私问题提出了一种通用、高效的私有草图(private sketch)方法。差分隐私通过严格的数学定义量化隐私与效用的权衡,但在实际应用中,通用算法运行缓慢(中等规模数据集可能需要数小时至数天),因此现有方法多为特定任务设计。本文提出的草图是一种紧凑的数据集摘要,支持回归、分类、密度估计等多种机器学习任务,其核心思想是将众多机器学习目标函数规约为核和(kernel sums)计算。草图利用局部敏感哈希(LSH)索引的随机列联表来估计核和,具有简单、可合并(mergeable)、单遍流式处理等特性,非常适合大规模分布式环境。实验表明,在包含6500万节点的Friendster图数据集上,该方法可在20分钟内完成单遍处理,而现有替代方案由于维度增长呈指数级缓慢,完全不可行。全面的实验评估显示,该方法的隐私-效用权衡与现有算法相当,但计算成本降低了一个数量级。预计该草图将在分布式、大规模机器学习设置中具有实用价值。

💡 推荐理由: 该研究为大规模分布式机器学习系统提供了首个通用的、可合并的差分隐私草图方法,大幅降低了隐私保护计算的开销,有望推动差分隐私在高维、大规模场景下的实际部署。

🎯 建议动作: 研究跟进,评估其在实际分布式系统中的适用性

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)