#supply-chain-security 主题 - Cyber Security Daily Radar

👥 作者: Hala Alia, Andrew Case, Irfan Ahmed

现代软件开发高度依赖来自公共仓库的第三方组件，这扩大了软件供应链攻击面。为了应对这一风险，美国联邦倡议推动了软件物料清单（SBOM）作为标准化机制，通过描述软件组件、依赖关系及其关联来提升透明度。然而，基于元数据或文件系统工件构建的SBOM无法捕获运行时加载和执行的组件，尤其是在Python等动态生态系统中。此外，通过插桩生成运行时SBOM需要提前部署监控并保持系统可观测，这在生产环境和事件响应场景中难以满足。相比之下，易失性内存为恢复运行中应用程序的实际运行时状态提供了可靠来源，无需事先插桩。本文提出了MEM-SBOM，首个直接从Python应用程序运行时状态生成SBOM的内存取证框架。它从解释器内部结构恢复模块、解析包版本、分析字节码以构建依赖图并识别易受攻击的函数。我们将MEM-SBOM实现为一套Volatility 3插件，并针对51个真实世界Python应用进行了评估。结果显示，它实现了100%的提取准确率，识别出Streamlit是唯一调用tornado依赖中易受攻击例程的应用，并恢复了现有SBOM工具遗漏的所有运行时包，提供了更准确的依赖图和更好的漏洞评估。这些能力使MEM-SBOM成为软件供应链安全和事件响应的实用基础，通过对系统上实际执行的内容提供取证可靠的运行时视图。

💡 推荐理由: 现有SBOM工具无法反映运行时真实依赖，导致安全评估盲区。MEM-SBOM利用内存取证技术，无需预先监控即可生成准确的运行时SBOM，为供应链安全审计和事件响应提供关键支撑。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Igor Santos-Grueiro

该论文针对软件包生态系统中发布路径的权威性问题，提出了一种前驱感知的发布权威记录方法。该方法通过比较每个包版本与其直接前驱版本在发布者、仓库、CI工作流、来源凭证、签名和中介证据等多个维度的差异，来识别发布路径上的不连续点。作者对npm、PyPI、Maven Central、crates.io和RubyGems五个注册表进行了有目的的抽样审计，时间跨度为2024年4月至2026年6月，分析了45,812个版本、43,100个有效前驱比较和942个包坐标。Go作为VCS/代理/校验和日志边界适配器单独报告。通过透明规则识别出204个策略触发的发布路径不连续事件。这些触发策略作为主要候选队列。统一的语义距离规则选出了320个版本，覆盖了190/204个触发事件；一个描述性的特定注册表规则选出了337个版本，覆盖了全部204个触发事件。在60行的盲测共享核心中，三名从业者将20/30个触发事件评为立即审查，9/30评为监控，1/30评为无需审查，所有30个对照均评为无需审查。这些信号是基于公开发布路径证据的审查线索。外部对齐中的精确恶意版本与策略触发事件无重叠。同路径入侵、未改变的受损CI、以及公共快照中缺失的版本需要独立于本发布路径记录之外的证据。

💡 推荐理由: 软件供应链安全中，包注册表依赖关系被视为信任基础，但发布路径的变更（如发布者、CI变更）可能引入风险。该工作首次系统化测量发布权威性，为检测供应链攻击提供了新的审查线索。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Siyuan Pang, Zhengwei Jiang, Yepeng Yao, Zijing Fan, Haozhe Li, Baoxu Liu

该论文针对开源软件供应链中恶意PyPI包的检测问题展开研究。现有方法主要依赖规则或传统机器学习，存在可解释性差、难以应对新型攻击等缺陷。为此，作者提出一种名为PYPILINE的新型检测方法，该方法将可疑API知识库与Agent工作流相结合。首先，PYPILINE对已知恶意包进行静态分析，提取抽象语法树并生成API调用图，从中自动提取并构建结构化的可疑API知识库。在检测阶段，利用该知识库增强推理能力，通过Agent工作流对未知包进行深度语义分析，并输出结构化、可解释的恶意性评估报告。实验结果表明，PYPILINE在精度（96.7%）、召回率（99.6%）和F1分数（98.1%）上显著优于现有最先进工具，精度比基线工具高出5.7至24.2个百分点。此外，论文还对恶意包进行了实证研究，系统揭示了常见的攻击策略以及最常被滥用的API。PYPILINE配备了支持工具调用的AI Agent工作流，用于自动向量数据库检索可疑API知识，并通过邮件服务器发送分析报告，提供了一种实用、高效、便捷的恶意包检测解决方案，以增强开源生态系统的安全性。该研究适合安全工程师、软件供应链安全研究人员以及PyPI生态维护者阅读。

💡 推荐理由: PyPI已成为恶意软件供应链攻击的重灾区，现有检测手段可解释性差且难以应对新型攻击。PYPILINE通过结合知识库与Agent工作流，显著提升了检测精度与可解释性，为防御方提供了可落地的自动化分析方案。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Zhuoran Tan, Yutian Tang, Jeremy Singer, Christos Anagnostopoulos, Ke Xiao

该论文提出了一种名为 FuseChain 的运行时检测框架，旨在应对软件供应链攻击的多阶段、跨源和时间分布特性。现有运行时检测系统通常独立分析不同来源的遥测数据（如包管理、进程事件、网络流量、DNS/HTTP 元数据和安全告警），难以发现低频攻击证据或重建攻击的时间上下文。FuseChain 将这些多源遥测数据统一表示为时间异构图，在统一的事件时间轴上对齐，从而捕捉跨源依赖和稀疏的攻击证据。它从良性前缀遥测数据中学习以异常为中心的时间表示，并通过一个轻量级解码器在冻结异常检测骨干网络上实现可部署的攻击阶段重建。实验表明，在稀疏且不平衡的运行时供应链遥测数据下，联合优化异常检测与阶段预测效果不佳。在七个供应链攻击场景中，FuseChain 使用冻结骨干解码器将可部署的阶段重建召回率（Stage Recall@500）从 0.369 提升至 0.881，自适应检索进一步将可观测阶段召回率从 0.524 提升至 0.655，且无需修改检测器。这些结果突显了将运行时供应链异常检测与下游攻击阶段解释解耦的部署价值。

💡 推荐理由: 软件供应链攻击日益复杂，传统单源检测难以发现跨阶段、跨源的攻击痕迹。FuseChain 通过统一图建模和解耦设计，显著提升了攻击阶段重建的准确性，为实际部署提供了可行方案。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Daniil Lopatkin, Maksim Mitrofanov, Stanislav Rakovsky, Aleksandr Khalikov

MOLOT（恶意操作逻辑观察Transformer）是一种面向SAST（静态应用安全测试）场景的静态恶意代码检测系统。在SAST环境中，软件包元数据、维护者历史记录和动态执行轨迹等信息可能不可用或不可信，MOLOT通过分析源代码的静态调用图，将代码表示为行为序列（behavior sequences），从而进行恶意性判断。系统包含一个解释阶段，能够对可疑行为活动进行排序，并将其映射回源代码中的具体位置，提供可解释的检测结果。方法在PyPI和npm上的Python和JavaScript包上进行了评估，与多个开源检测工具进行了比较，并在实际审核工作流中验证了产品级约束（运行时间、内存使用、误报率）。此外，研究团队发布了Open Malicious-Code Bench，这是一个公开基准，用于可重复地评估恶意包检测方法。结果表明，静态行为序列建模能够为现代DevSecOps工作流提供准确、可解释且可部署的恶意代码检测。适合安全分析师、DevSecOps工程师和软件供应链安全研究人员阅读。

💡 推荐理由: 提出一种不依赖元数据或动态执行的静态恶意代码检测方法，适合供应链安全场景，且具备可解释性。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Zehra Karadağ, René Walendy, Carina Wiesen, Christof Paar, Nikol Rummel, Steffen Becker

本文总结了一项为期八年的硬件逆向工程（HRE）课程的设计经验与教训。集成电路（IC）的全球化制造流程面临供应链安全威胁，而HRE是检测这些威胁、重建信任的关键技术，但相关专业人才因缺乏教育项目而稀缺。该课程面向欧洲某研究型大学低年级本科生，重点教授数字电路分析和数字电路提取。课程从2017年至2025年迭代九次，多名校友后续从事HRE工作。作者反思了课程组织、内容和作业的演变，提炼出关键经验，并转化为设计优先级，强调迭代增长和可持续的工作量管理，为在快速发展的技术领域开发课程的 educators 提供 actionable insights。

💡 推荐理由: 硬件逆向工程是检测芯片供应链威胁的核心手段，但教育体系严重缺位。该课程经验可为培养安全人才提供参考，对蓝队评估硬件安全风险有间接价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.4)

👥 作者: Shravya Kanchi, Xiaoyan Zang, Ying Zhang, Danfeng Yao, Na Meng

该论文针对现代软件开发中广泛使用第三方库（Lib）所带来的供应链安全风险问题，提出了一种名为PoVSmith的新方法，用于自动生成可执行的漏洞验证测试（PoV tests）。当前开发者通常需要具体的、可执行的证据来判断一个依赖漏洞是否对其应用构成实际安全风险，但手动编写这类测试非常困难，现有的自动化工具支持不足。PoVSmith结合了调用路径分析、示例测试、代码上下文和执行反馈，通过多个提示引导编码代理（Codex）和大型语言模型（GPT）进行测试生成、执行和评估。具体来说，它首先识别应用程序中调用易受攻击库API的入口点（即公共方法），然后利用这些信息生成测试用例。在33个Java程序对（App-Lib）上的实验表明，PoVSmith成功识别了158个独特的应用级入口点，其中152个（96%）被正确识别并配以正确的调用路径。基于这些方法调用信息，它生成了152个测试，其中84个（55%）成功演示了利用库漏洞攻击应用程序的可行方式。与现有的基于LLM的方法相比，PoVSmith大幅减少了人工参与，同时显著提高了测试质量。该工作的贡献包括：（1）一种新颖的基于代理的测试生成方法；（2）由执行反馈驱动的迭代代码精炼过程；（3）基于测试上下文和执行日志的LLM质量评估。

💡 推荐理由: 本文提出了一种自动化生成漏洞验证测试的方法，能够帮助开发者高效判断第三方库漏洞的真实风险，减少人工工作量，提升软件供应链安全评估的实用性。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Sk Tanzir Mehedi, Raja Jurdak, Chadni Islam, Abu Bakar Siddique Mahi, Gowri Ramachandran

eDySec 是一个基于深度学习的动态行为分析框架，旨在检测 PyPI 生态系统中的恶意包。随着下一代软件供应链攻击（如多阶段恶意软件执行、远程访问激活和动态载荷生成）的兴起，传统机器学习检测器因动态行为数据的高维稀疏性（包括系统调用、网络流量、目录访问模式和依赖日志）而性能下降、稳定性差且缺乏可解释性。本文利用 QUT-DV25 数据集（捕获包安装时和安装后行为）评估多种深度学习模型，并研究特征集以识别最具判别力的属性。框架整合了模型稳定性分析和可解释 AI 技术，提供稳定的透明决策。实验结果表明，eDySec 显著优于现有方法：将特征维度减半，误报率降低 82%，漏报率降低 79%，准确率提升 3%，并达到近乎完美的稳定性，每个包推理延迟仅 170 毫秒。研究还发现特征与模型选择至关重要，某些组合会降低性能。该工作深化了对动态分析应对下一代攻击的优势与局限的理解。

💡 推荐理由: 针对 PyPI 生态中日益复杂的供应链攻击，eDySec 提供了高精度、低延迟且可解释的检测方案，解决了传统 ML 方法在高维稀疏数据下的瓶颈。

🎯 建议动作: 研究跟进，评估该框架在内部环境中的适用性

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#supply-chain-security

What You See Is Not What You Execute: Memory-Based Runtime SBOM Generation for Supply Chain Security

On Good Authority: Release-Authority Measurement for Registry-Mediated Package Ecosystems

PYPILINE: Malicious PyPI Package Detection via Suspicious API Knowledge and Agent Workflow

FuseChain: Runtime Evidence Reconstruction for Software Supply-Chain Attacks

MOLOT System Card: Malicious Operational Logic Observation Transformer

Designing a Hardware Reverse Engineering Course: Lessons from Eight Years in a Rapidly Evolving Tech Domain

Generating Proof-of-Vulnerability Tests to Help Enhance the Security of Complex Software

eDySec: A Deep Learning-based Explainable Dynamic Analysis Framework for Detecting Malicious Packages in PyPI Ecosystem