该论文针对音乐流媒体平台中的人为篡改播放量欺诈问题,提出了一种可扩展的自动门控集成方法SAGE。传统欺诈检测方法在区分超级粉丝、助眠音乐等合法边缘场景与协调欺诈行为时面临挑战,因为两者行为模式高度相似。SAGE结合了SimHash分层层抽样与模块化门控集成,从无标签数据中高质量地筛选出负面样本(即确定非欺诈的样本),解决了正样本-无标签学习中的表示偏差问题。其集成的统计门控(目前通过马氏距离和k-NN密度实现)具有可配置的投票阈值,能够自适应调整精确率与召回率的平衡。通过在保持数据集上对客户级和艺术家级欺诈的检测验证,该方法表现出较强的精确率和召回率,且核心方法无需修改即可推广至其他欺诈检测领域。
💡 推荐理由: 为流媒体平台提供了一种高效的负面样本自动筛选技术,有助于改善欺诈检测模型的训练数据质量,降低人工标注成本,并提升对隐蔽欺诈行为的识别能力。
🎯 建议动作: 研究跟进