#overthinking 主题 - Cyber Security Daily Radar

👥 作者: Shuqiang Wang, Wei Cao, Jiaqi Weng, Jialing Tao, Licheng Pan, Hui Xue, Zhixuan Chu

本文研究大型推理模型（LRMs）在面对逻辑不一致或不完整输入时，倾向于产生过长且冗余的推理轨迹，即“过度思考”现象，这会导致推理延迟和能耗显著增加，构成潜在的拒绝服务（DoS）攻击向量。作者提出一种自动化黑盒框架，通过层次遗传算法（HGA）系统性地扰动输入问题的逻辑结构，以诱导LRMs过度思考。该算法在结构化问题分解上运行，并优化复合适应度函数，旨在最大化响应长度和反思性过度思考标记。在四个最先进的推理模型上，该方法在MATH基准测试中实现了高达26.1倍的输出长度增加，持续优于良性基线和手动构造的缺失前提基线。此外，攻击输入具有良好的可迁移性，使用小型代理模型进化的对抗输入对大型商业LRMs仍然高度有效。研究结果强调了过度思考是现代推理系统中一个共享且可利用的漏洞，亟需更强健的防御措施。适合安全研究人员、AI系统开发者及关注LLM安全性的从业者阅读。

💡 推荐理由: 揭示LRMs在逻辑矛盾输入下产生过度思考的漏洞，可被黑盒利用导致计算资源耗尽，对依赖LLM推理的应用构成实际威胁。

🎯 建议动作: 研究跟进：评估自身LRM部署对此类攻击的敏感性，并纳入风险评估流程。

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

#overthinking

Inducing Overthink: Hierarchical Genetic Algorithm-based DoS Attack on Black-Box Large Language Reasoning Models