#data cleaning

共收录 2 条相关安全情报。

← 返回所有主题
推荐 9.5
Conf: 50%
👥 作者: Erik-Oliver Blass, Florian Kerschbaum

本文首次提出并研究了隐私保护的协作数据清理问题。在协作数据清理场景中,两方希望协调各自的数据集,以过滤掉错误分类或误分类的数据项。隐私保护版本的目标是:各方仅能了解自己数据中被误分类的项,而无法获知对方数据集的任何其他信息。私有数据清理本质上是私有集合交集(PSI)的一种变体,可以利用现有的电路PSI技术来私密地计算误分类。然而,作者针对私有数据清理的特殊性设计、分析并实现了三种新协议,性能优于基于电路PSI的方法。第一种协议利用一个小的额外泄漏(数据项交集差异隐私大小)来降低复杂度;另外两种协议将寻找数据分类不匹配的问题转化为寻找匹配,然后采用标准的不经意伪随机函数(OPRF)技术来计算PSI,根据数据类别的数量,相比电路PSI实现了具体的运行时改进。

💡 推荐理由: 该研究为隐私保护的数据协作提供了高效方案,适用于需要联合清理数据但不愿泄露数据的场景(如金融、医疗)。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
推荐 9.4
Conf: 50%
👥 作者: Erik-Oliver Blass, Florian Kerschbaum

本文研究了隐私保护协作数据清洗问题。在协作数据清洗中,两方希望调和各自的数据集,以过滤掉分类错误的数据项。隐私保护版本增加了安全目标:各方仅能了解自己分类错误的数据项,而不能获知对方数据集的其他信息。该问题本质上是隐私集合交集(PSI)的变体,理论上可采用电路PSI技术实现。然而,作者针对私有数据清洗的特性,设计、分析并实现了三种新协议,性能优于电路PSI。第一种协议利用少量附加泄漏(数据项交集差分隐私大小)来降低复杂度;另外两种协议将数据分类不匹配问题转化为匹配问题,然后采用标准的不经意伪随机函数(OPRF)技术计算PSI。实验表明,根据数据类别数量的不同,协议相比电路PSI有具体的运行时间提升。本文主要贡献在于提出了适合私有数据清洗的高效协议,并通过理论分析和实验验证了其优势。适合研究安全多方计算、隐私保护数据清洗的研究者阅读。

💡 推荐理由: 该研究为隐私保护数据清洗提供了高效协议,有望在多方数据协作场景中减少泄漏风险,同时提升性能,对数据融合和隐私合规有参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.4)