推荐 3.5
Conf: 50%
本文对 Anchored Decoding 中使用的 k-NAF (k-ary Normalized Attention Flow) 预算核算机制进行了实证审计。研究采用两类实验:一是固定、类别分层的负载(约 8500 次随机执行,覆盖六种提示类别),二是针对高代理支出比率的自适应提示搜索流程。在固定负载下,平均累积 KL 散度远低于序列级预算 K(K=600 和 1000),且基于经验 Bernstein 风格的代理指标在所有类别中均低于 K;表面重叠诊断(ROUGE-L 和 5-gram Jaccard)相应较小。自适应搜索提高了代理支出比率,但未导致预算明显耗尽。在 k=3 的保留版权域负载中,一些提示在早期停止评估且实现样本量较小时,代理比率超过 1;使用更大分配重新评估相同提示后,在可比平均支出下代理比率降至 [0.26, 0.40] 范围,这更符合代理伪影而非每条轨迹的预算失败。因此,该机制在实践中有效,未发现系统性预算违规。
💡 推荐理由: 该论文实证评估了 Anchored Decoding 中防止超额计算的关键预算机制,对 LLM 服务的安全性(如拒绝服务防护、成本控制)具有参考价值。
🎯 建议动作: 研究跟进
排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)