#automatic-grading

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Hang Li, Fedor Filippov, Yuling Lin, Pengfei He, Kaiqi Yang, Yucheng Chu, Yingqian Cui, Hui Liu, Jiliang Tang

本论文研究基于大语言模型的自动评分(AG)系统中的提示注入攻击。随着LLM在自动评分中的广泛应用,其安全风险日益突出。攻击者可能通过提示注入操纵评分系统,使系统无论答案质量如何都给出高分,严重威胁教育评估的公平性、可靠性和完整性。作者系统性地研究了此类攻击在教育场景中的有效性,并评估了现有防御策略的效果。实验表明,当前基于LLM的自动评分系统仍然高度易受提示注入攻击。该研究旨在提高对这一新兴威胁的认识,并推动未来构建安全、稳健和可信的LLM教育系统。

💡 推荐理由: 提示注入攻击可能破坏基于LLM的自动评分系统的公平性,威胁大规模在线考试和教育评估的可信度。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)