#system-evolution 主题 - Cyber Security Daily Radar

👥 作者: Yajie Zhou, Ao Li, Ashwin Silla, Zaoxing Liu, Vyas Sekar

该论文关注AI驱动系统进化中隐藏的弱点问题。近年来，计算机系统社区对AI驱动的系统进化兴趣日益增长，即利用AI智能体迭代地重写系统代码。例如AdaEvolve和Engram等框架声称相比于人工设计算法可获得12-60%的分数提升。然而，这些AI进化程序可能在未见过的负载上表现更差，或出现可扩展性退化，这引发了实际担忧。鉴于AI生成代码的速度和规模，需要自动化机制来发现此类隐藏弱点。为此，作者提出AIChilles系统，它以基线程序P和AI进化程序P'为输入，自动搜索有效的负载，使得P'在正确性、运行时间、内存使用或输出质量方面相对于P发生退化。为应对系统应用的多样性、弱点类型和潜在错误，AIChilles结合了确定性工作负载参数提取、基于智能体的约束推断、差分预言机以及代码频率覆盖等技术，以发现多样化的故障。在5个系统应用和30个AI进化程序上的实验表明，AIChilles共发现了49个不同的隐藏弱点。此外，将AIChilles显式纳入AI驱动的开发周期可以有效缓解其中的若干弱点。该工作展示了自动化评估和提升AI生成代码鲁棒性的重要方向。

💡 推荐理由: 随着AI自动生成代码在系统领域的应用增加，这些代码可能隐藏性能或正确性退化，AIChilles提供了首个自动化发现此类弱点的工具，对保障AI进化系统的可靠性和安全性至关重要。

🎯 建议动作: 阅读论文并评估AIChilles工具，考虑纳入内部AI代码安全评估流程。

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#system-evolution

AIChilles: Automatically Uncovering Hidden Weaknesses in AI-Evolved Systems