本文系统性地从六个引擎级安全属性评估了五种AI代码沙箱产品隔离访客代码与宿主内核的能力。六个维度包括:1.1 宿主攻击面、1.2 信息泄露、1.3 纵深防御可堆叠性、1.4 公开CVE历史、1.5 补丁节奏、1.6 上游模糊测试状态。研究强调单一维度不足以支撑比较判断,交叉分析才是关键。主要发现有三点:(1) 引擎类别(微VM、用户态内核、OCI容器)在每个架构维度上均明显区分,但同类产品间差异不大;(2) 产品引脚策略是主导操作者变量——引擎侧补丁延迟在协同披露下平均约0天,而下游滞后从0天到471天以上,甚至“不透明”或无限;(3) 模糊测试投入分为三个层次,而“微VM × 持续公开模糊测试”的最强组合在本研究集中空缺,导致“0个已发布CVE × 无上游模糊测试 × 无学术研究”的交集在结构上未被测量。报告给出了各维度的排序、各产品的画像以及威胁模型限定矩阵,未提出总体排名。配套代码仓库开源(Apache-2.0)。适合安全架构师、沙箱开发者及AI平台安全评估人员阅读。
💡 推荐理由: 首次从多引擎维度交叉分析AI代码沙箱安全,弥补了单一指标比较的不足,为蓝队选择或评估沙箱产品提供了系统方法论与实证数据。
🎯 建议动作: 研究跟进:深入阅读原文并与内部沙箱产品对比评估;关注配套代码库更新。