#troll-detection 主题 - Cyber Security Daily Radar

👥 作者: Jaehong Kim, Hyeonseung Kim, Jiseon Kim, Alice Oh, Thorsten Holz, Wonjae Lee, Meeyoung Cha

该论文针对协调性外国影响行动（即国家背景的水军/信息攻击）对在线平台构成的日益严重的威胁，提出了一种可解释的机器学习框架，用于在韩国在线新闻评论区检测疑似水军行为并进行纵向分析。研究背景是：尽管此类攻击日益普遍，但检测与国家级黑客相关联的账户活动并追踪其演变仍具挑战。核心方法：作者构建了一个层次化分类模型，从三个维度对评论进行分类：外国来源（是否由境外操控）、道德-情感框架（如谴责、赞扬）以及目标国家。模型还通过提取跨度级文本证据（即评论中关键的短语或句子）来提供可解释性，使人类审核者能理解分类理由。他们在近20年间（约2000年至2020年）采集的112M条韩国新闻评论（来自4M用户）上应用该框架，识别出23,998个表现出与协调操控一致行为的账户。主要发现：这些疑似水军账户主要依赖道德谴责修辞，而非直接推广亲外国的叙事；这种谴责性修辞获得了显著更高的用户参与度（点赞、回复等）。在参与度最高的评论中，道德谴责最常针对国内政治人物（包括左右翼的总统或政党领袖），这可能加剧社会极化。实验证明：该框架能有效区分水军与普通用户，其可解释性模块有助于平台进行透明、基于证据的审核。论文的贡献在于提供了一个可迁移的分析工具，揭示了韩国语境下信息攻击的长期演化模式，并为其他地区类似攻击的检测与防御提供了参考。适合安全分析师、平台治理人员及社会科学研究者阅读。

💡 推荐理由: 该研究揭示了信息攻击中道德谴责修辞的关键作用，并提供了经20年数据验证的可解释检测框架，有助于平台识别和优先处理最具影响力的操控内容。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#troll-detection

Cross-National Information Attacks: A Two-Decade Analysis of Troll Behavior in Korea