推荐 10.5
Conf: 50%
本论文研究基于大语言模型的自动评分(AG)系统中的提示注入攻击。随着LLM在自动评分中的广泛应用,其安全风险日益突出。攻击者可能通过提示注入操纵评分系统,使系统无论答案质量如何都给出高分,严重威胁教育评估的公平性、可靠性和完整性。作者系统性地研究了此类攻击在教育场景中的有效性,并评估了现有防御策略的效果。实验表明,当前基于LLM的自动评分系统仍然高度易受提示注入攻击。该研究旨在提高对这一新兴威胁的认识,并推动未来构建安全、稳健和可信的LLM教育系统。
💡 推荐理由: 提示注入攻击可能破坏基于LLM的自动评分系统的公平性,威胁大规模在线考试和教育评估的可信度。
🎯 建议动作: 研究跟进
排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)