#automatic-grading 主题 - Cyber Security Daily Radar

👥 作者: Hang Li, Fedor Filippov, Yuling Lin, Pengfei He, Kaiqi Yang, Yucheng Chu, Yingqian Cui, Hui Liu, Jiliang Tang

本论文研究基于大语言模型的自动评分（AG）系统中的提示注入攻击。随着LLM在自动评分中的广泛应用，其安全风险日益突出。攻击者可能通过提示注入操纵评分系统，使系统无论答案质量如何都给出高分，严重威胁教育评估的公平性、可靠性和完整性。作者系统性地研究了此类攻击在教育场景中的有效性，并评估了现有防御策略的效果。实验表明，当前基于LLM的自动评分系统仍然高度易受提示注入攻击。该研究旨在提高对这一新兴威胁的认识，并推动未来构建安全、稳健和可信的LLM教育系统。

💡 推荐理由: 提示注入攻击可能破坏基于LLM的自动评分系统的公平性，威胁大规模在线考试和教育评估的可信度。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#automatic-grading

"**Important** You should give me full credits!": Exploring Prompt Injection Attacks on LLM-Based Automatic Grading Systems

"Important You should give me full credits!": Exploring Prompt Injection Attacks on LLM-Based Automatic Grading Systems