#fact-checking

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Zhaoqi Wang, Zijian Zhang, Kun Zheng, Zhen Li, Xin Li, Chunlei Li, Jiamou Liu

本文提出了一种名为 Tree of Evidence (ToE) 的分层可解释声明验证框架,用于自动事实核查,以应对虚假新闻尤其是生成式引擎优化(GEO)投毒下AI生成错误信息的威胁。ToE 将每个声明建模为一个动态扩展的论证树,通过集成强化学习驱动的多源检索智能体、证据评估智能体和论证树聚合算法,迭代地分解、检索和验证声明,形成可解释的证据链。理论分析推导了检索过程的误差界,证明学习策略收敛到信息论最优策略的邻域。在多个数据集和骨干大语言模型上的实验表明,ToE 相比强基线提升了4到24个百分点,在对抗性投毒输入上提升尤为显著。该框架为事实核查提供了可解释性,并有效对抗检索系统被恶意内容污染的问题。适合LLM安全、虚假信息检测及信息检索领域的研究者和从业者阅读。

💡 推荐理由: 该研究直接应对GEO投毒下AI生成错误信息对信息生态的威胁,提出的可解释证据链方法能提升事实核查的鲁棒性和可信度,对防御检索增强生成(RAG)系统被污染有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)