#system-evolution

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Yajie Zhou, Ao Li, Ashwin Silla, Zaoxing Liu, Vyas Sekar

该论文关注AI驱动系统进化中隐藏的弱点问题。近年来,计算机系统社区对AI驱动的系统进化兴趣日益增长,即利用AI智能体迭代地重写系统代码。例如AdaEvolve和Engram等框架声称相比于人工设计算法可获得12-60%的分数提升。然而,这些AI进化程序可能在未见过的负载上表现更差,或出现可扩展性退化,这引发了实际担忧。鉴于AI生成代码的速度和规模,需要自动化机制来发现此类隐藏弱点。为此,作者提出AIChilles系统,它以基线程序P和AI进化程序P'为输入,自动搜索有效的负载,使得P'在正确性、运行时间、内存使用或输出质量方面相对于P发生退化。为应对系统应用的多样性、弱点类型和潜在错误,AIChilles结合了确定性工作负载参数提取、基于智能体的约束推断、差分预言机以及代码频率覆盖等技术,以发现多样化的故障。在5个系统应用和30个AI进化程序上的实验表明,AIChilles共发现了49个不同的隐藏弱点。此外,将AIChilles显式纳入AI驱动的开发周期可以有效缓解其中的若干弱点。该工作展示了自动化评估和提升AI生成代码鲁棒性的重要方向。

💡 推荐理由: 随着AI自动生成代码在系统领域的应用增加,这些代码可能隐藏性能或正确性退化,AIChilles提供了首个自动化发现此类弱点的工具,对保障AI进化系统的可靠性和安全性至关重要。

🎯 建议动作: 阅读论文并评估AIChilles工具,考虑纳入内部AI代码安全评估流程。

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)