#hardware-benchmarking 主题 - Cyber Security Daily Radar

👥 作者: Faruk Alpay, Baris Basaran

该论文针对硬件性能测试报告的可信度问题提出了一种自验证的测量记录方法。当前硬件基准测试结果通常依赖读者信任，但实际中可能存在硬件错误（例如每千个核心中约有一个返回无错误提示的错误算术结果）。作者构建了一种防篡改、可独立验证的测量记录结构：论文中每个文本、表格或图表中的数值通过其内容哈希绑定到对应的观测和验证过程；整个记录构成一个哈希链接的仅追加结构（测量透明度日志），验证者无需信任生产者即可离线审计。对于矩阵乘积等运算，采用概率性身份验证（Freivalds算法），在浮点误差分析推导的容差范围内以O(k n^2)成本进行检验，错误乘积被拒绝的概率为1-2^{-k}；其他无法进行此类验证的量则附带代数校验和以及可重复性类别。进一步将检查本身视为安全对象：承诺用于离线可重复性的探针种子构成攻击面，而探针感知的对手可以在探针的零空间中隐藏破坏，甚至欺骗大多数位相同的见证者；通过从声称输出派生的Fiat-Shamir挑战可消除此漏洞。实验表明，从未授权租户的访问层面使用di/dt功率病毒和热浸泡驱动设备，既不会改变校准容差也不会产生静默错误，从而将物理故障威胁限定在罕见缺陷部件或特权攻击者，并标记了记录必须与硬件信任根组合的边界。作者在Blackwell和Hopper GPU上演示了该构造，并报告了不同精度、规模和设备下的残差底限和可重复性映射。

💡 推荐理由: 为硬件基准测试提供了可独立验证、防篡改的审计机制，有助于提升对硬件性能声明的信任，尤其对涉及安全关键或合规场景的硬件采购与评估具有参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#hardware-benchmarking

Self-Verifying Measurement Records: Hash-Linked Evidence Graphs for Hardware Benchmarking