#research-pitfalls 主题 - Cyber Security Daily Radar

👥 作者: Jonathan Evertz, Niklas Risse, Nicolai Neuer, Andreas Müller 0025, Philipp Normann, Gaetano Sapia, Srishti Gupta 0004, David Pape, Soumya Shaw, Devansh Srivastav, Christian Wressnegger, Erwin Quiring, Thorsten Eisenhofer, Daniel Arp, Lea Schönherr

本文系统性地探讨了大语言模型（LLM）在安全研究中引入的独特挑战。作者识别出九个常见陷阱，这些陷阱涵盖从数据收集、预训练、微调到提示工程和评估的整个计算流程，可能损害研究的有效性。为了评估这些陷阱的普遍性，作者分析了2023至2024年间发表在顶级安全与软件工程会议（如IEEE S&P、USENIX Security、ICSE等）上的72篇经同行评审的论文。结果发现每篇论文至少包含一个陷阱，且每个陷阱在多篇论文中出现，但仅有15.7%的陷阱被作者明确讨论，表明大多数陷阱未被研究者意识到。为进一步理解这些陷阱的实际影响，作者开展了四项实证案例研究，展示了单个陷阱如何误导评估结果、夸大性能或损害可复现性。例如，不恰当的基线选择或数据泄露会导致虚假的性能提升。基于发现，作者提出了一系列可操作指南，包括在论文中明确报告数据分割、参数设置、评估指标和随机种子，以及使用标准化测试集和鲁棒性检查。该研究为LLM安全研究的可复现性和严谨性提供了重要警示，适合从事LLM安全研究的研究人员、审稿人和从业者阅读。

💡 推荐理由: 揭示了LLM安全研究中普遍存在但被忽视的方法论陷阱，为提升研究可复现性和可靠性提供关键指南。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#research-pitfalls

Chasing Shadows: Pitfalls in LLM Security Research.