#alternative data 主题 - Cyber Security Daily Radar

👥 作者: Hongzhe Zhang, Jiarong Xu, Jing He, Xiao Fang

信用风险预测是消费信贷行业的核心问题。传统上，金融机构使用借款人的人口统计、财务和信用历史数据（统称为传统数据）构建预测模型。近年研究表明，替代数据（如手机通信数据）能为贷方提供更全面准确的借款人信用评估，从而提升预测性能。然而，替代数据由独立于金融机构的外部实体持有，直接共享会侵犯消费者隐私，现有研究大多忽略此问题。为填补空白，本文定义了隐私保护的信用风险预测新问题，需同时满足三个实际约束：保护消费者隐私的隐私保护约束、在金融机构集中学习并存储模型的模型保密约束，以及维持模型性能的无损约束。为此，作者提出 PrivacyCredit，一种新颖的隐私保护机器学习方法，并从理论上证明其满足隐私保护、模型保密和无损特性。通过使用与替代数据关联的真实信贷数据集进行广泛实验，展示了安全整合替代数据于信用风险预测中的预测价值，并证明 PrivacyCredit 达到了与从传统数据与替代数据不安全明文组合中学习的模型相同的预测性能。文章还评估了其模型保密特性和计算效率。

💡 推荐理由: 该研究为金融机构安全整合外部替代数据提供了可行方案，在保护消费者隐私和模型机密性的同时不牺牲预测性能，对合规数据共享和隐私计算落地有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#alternative data

Privacy-Preserving Credit Risk Prediction with Alternative Data