#sql-injection 主题 - Cyber Security Daily Radar

👥 作者: Ali Karakoc, H. Birkan Yilmaz

本文针对SQL注入（SQLi）攻击这一长期位列OWASP Top 10的安全威胁，探索利用大型语言模型（LLM）自动化生成对抗性SQL注入测试载荷的方法。作者提出了两种新型基于LLM的系统：RADAGAS（基于检索增强生成的对抗性SQLi生成）和RefleXQLi（基于反思链式思维的SQLi生成），并与现有基线模型进行对比。实验针对10种Web应用防火墙（WAF）和1个基于MySQL的执行验证器展开，涵盖6种基于规则的开源WAF（ModSecurity PL1-3、Coraza PL1-3）、2种基于AI/ML的WAF（WAF Brain、CNN-WAF）以及2种商用WAF（AWS WAF、Cloudflare WAF）。使用的LLM模型包括GPT-4o、Claude 3.7 Sonnet和DeepSeek R1。共计开展240组实验，生成24万个载荷，并执行了220万次WAF绕过测试。结果表明，RADAGAS-GPT4o组合以22.73%的绕过率优于其他基线模型；所提出的RADAGAS变体在AI/ML型WAF上表现突出（RADAGAS-DeepSeek对WAF-Brain绕过率达92.49%，RADAGAS-Claude对CNN-WAF绕过率达80.48%），但在基于规则的WAF上绕过能力有限（对ModSecurity和Coraza的绕过率仅为0-5.70%）。此外，研究发现产生多样性较低的载荷更容易绕过，但若初始载荷失败则整体效果不佳。该研究为利用LLM进行安全测试提供了全面视角。

💡 推荐理由: 帮助蓝队了解LLM在自动化生成SQLi测试中的能力边界，特别是对不同类型WAF的绕过效果，从而评估自身防护体系的薄弱环节。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Farzad Nourmohammadzadeh Motlagh, Mehrdad Hajizadeh, Mehryar Majd, Pejman Najafi, Feng Cheng, Christoph Meinel

该论文针对大型语言模型（LLM）驱动的应用中自然语言接口带来的SQL注入风险，提出了一种多层级安全框架。随着LLM被广泛用于将用户自然语言查询自动转换为SQL语句（Prompt-to-SQL），传统的SQL注入攻击方式得以进化：攻击者可以构造对抗性提示（adversarial prompts），引导模型生成恶意SQL查询，从而绕过基于查询字符串校验的传统防御。论文框架由三层组成：前端安全盾（Front-end Security Shield）负责对用户输入进行净化，过滤明显恶意内容；高级威胁检测模型（Advanced Threat Detection Model）利用行为和语义异常分析识别更隐蔽的攻击；特征签名控制层（Signature-based Control Layer）匹配已知攻击模式。研究团队构建了包含提示注入、混淆SQL负载、上下文操控等多样攻击场景的基准数据集，并在微调后的LLM上进行了全面评估。实验结果显示，该框架在保持低误报率的前提下实现了高检测准确率，显著提升了LLM驱动的数据库应用的安全性。论文贡献在于首次系统性地分析了LLM场景下SQL注入的新形态，并提出了一个实用的、可扩展的防御框架，为基于LLM的数据查询应用的安全部署提供了技术参考。

💡 推荐理由: LLM驱动的自然语言查询数据库正快速普及，但Prompt-to-SQL过程放大了SQL注入风险，现有防御未能覆盖。该论文系统揭示了该攻击面并提供了可落地的多层检测框架，对安全团队构建AI应用防护有直接参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#sql-injection

Adversarial SQL Injection Generation with LLM-Based Architectures

When Prompts Become Payloads: A Framework for Mitigating SQL Injection Attacks in Large Language Model-Driven Applications