推荐 3.5
Conf: 50%
直播已成为社交互动和数字商务的主要媒介,但也面临日益复杂的风险。一个根本性挑战是战术型分布外(OOD)偏移:恶意行为者保持其稳定底层意图(如欺诈),但不断重新设计叙事包装(如话术、场景)以逃避检测。现有OOD泛化范式假设难以满足,因为意图与战术的紧密耦合以及原始层面反事实的难以定义。本文从潜在因果视角出发,提出潜在预测反事实解耦(LPCD)框架,一种即插即用的鲁棒直播风险评估方案。LPCD在潜在层面建模意图和叙事变化,通过强制潜在反事实一致性,将风险预测锚定在因果稳定的恶意意图上,从而在对抗性战术重包装下实现反事实推理。推理时,LPCD采用轻量级、无参数的校准进一步缓解战术引起的分布偏移。在大规模工业数据集和在线生产流量上的广泛实验表明,LPCD持续优于最先进基准,验证了其在实时直播中调控演化对抗风险的有效性。项目页面提供详细信息。
💡 推荐理由: 直播平台面临不断演化的对抗性风险,传统检测难以应对战术级OOD偏移。本文提出的潜在因果解耦方法为鲁棒风险评估提供了新思路,有助于提升安全系统对隐蔽意图的捕获能力。
🎯 建议动作: 研究跟进
排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)