推荐 3.5
Conf: 50%
该论文针对协调性外国影响行动(即国家背景的水军/信息攻击)对在线平台构成的日益严重的威胁,提出了一种可解释的机器学习框架,用于在韩国在线新闻评论区检测疑似水军行为并进行纵向分析。研究背景是:尽管此类攻击日益普遍,但检测与国家级黑客相关联的账户活动并追踪其演变仍具挑战。核心方法:作者构建了一个层次化分类模型,从三个维度对评论进行分类:外国来源(是否由境外操控)、道德-情感框架(如谴责、赞扬)以及目标国家。模型还通过提取跨度级文本证据(即评论中关键的短语或句子)来提供可解释性,使人类审核者能理解分类理由。他们在近20年间(约2000年至2020年)采集的112M条韩国新闻评论(来自4M用户)上应用该框架,识别出23,998个表现出与协调操控一致行为的账户。主要发现:这些疑似水军账户主要依赖道德谴责修辞,而非直接推广亲外国的叙事;这种谴责性修辞获得了显著更高的用户参与度(点赞、回复等)。在参与度最高的评论中,道德谴责最常针对国内政治人物(包括左右翼的总统或政党领袖),这可能加剧社会极化。实验证明:该框架能有效区分水军与普通用户,其可解释性模块有助于平台进行透明、基于证据的审核。论文的贡献在于提供了一个可迁移的分析工具,揭示了韩国语境下信息攻击的长期演化模式,并为其他地区类似攻击的检测与防御提供了参考。适合安全分析师、平台治理人员及社会科学研究者阅读。
💡 推荐理由: 该研究揭示了信息攻击中道德谴责修辞的关键作用,并提供了经20年数据验证的可解释检测框架,有助于平台识别和优先处理最具影响力的操控内容。
🎯 建议动作: 研究跟进
排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)