#game-theory

共收录 10 条相关安全情报。

← 返回所有主题
👥 作者: Achraf Hsain, Sultan Almuhammadi

本文重新审视了强化学习中的盾牌合成技术,指出其传统上作为运行时安全机制的定位存在偏差。作者提出将相同的自动机理论工具——规范编译、乘积博弈构建、吸引子计算和获胜区域提取——重新解读为设计时的分析仪器,其输出是对系统安全属性的结构性洞察,而非部署时的运行时约束。具体地,文章构建了一个受约束的双人安全博弈模型来模拟网络防御场景。在该博弈中,防御者和攻击者的规范被非对称地实施:防御者规范定义了博弈中的不安全区域,而攻击者规范则在吸引子计算过程中限制了对手的合法动作。通过求解该博弈,可以获得一个可防御性判定——即关于拓扑-规范配对是否可防御的形式化证书,以及相关联的获胜区域和盾牌。进一步地,作者从吸引子结构中推导出拓扑级别的度量,并将其与盾牌约束下的对抗性多智能体强化学习获得的收敛后行为相结合,共同构成一个可防御性指纹,该指纹同时捕捉了网络的形式化安全属性和在自适应对抗下的操作行为。通过假设分析(what-if analysis),文章发现形式化可防御性与操作有效性分别捕捉了安全的不同维度:微小的架构变化可能导致操作结果的巨大变化,而形式化安全裕度几乎不变。因此,盾牌合成的最大价值并非作为安全智能体的部署机制,而是作为回答系统是否、在哪里以及如何可被防御等架构问题的分析框架。可防御性判定是输出,而非安全策略。本研究适合网络安全研究人员、强化学习安全从业者以及系统架构师阅读,用于在设计阶段评估网络拓扑的防御能力。

💡 推荐理由: 本文提出将盾牌合成从运行时机制转变为设计时的可防御性分析工具,为网络防御提供了形式化验证与操作评估相结合的框架,有助于在部署前识别安全弱点和架构优化方向。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Saeid Jamshidi, Amin Nikanjam, Arghavan Moradi Dakhel, Kawser Wazed Nafi, Foutse Khomh

本文针对大型语言模型在多轮交互中长期上下文推理的安全性问题展开研究。在多轮对话中,LLM需要维护一个动态演变的上下文,而不仅仅是生成孤立回复,这使得模型容易受到提示注入和上下文投毒攻击——攻击者通过注入局部的看似合理的对抗性片段,逐步扭曲模型的推理轨迹。现有的防御手段主要关注单轮输出过滤,忽视了跨轮上下文的演化,导致长时间跨度的推理暴露在风险中。虽然模型上下文协议(MCP)标准化了上下文交换和工具调用,但它仅作为一个被动的路由层,无法强制执行上下文的稳定性。为此,本文提出了博弈论安全模型上下文协议(GT-MCP),一种控制器驱动的多智能体方法,将上下文管理视为一个闭环动态过程。GT-MCP协调三个异构的LLM智能体,并通过一个信任函数选择输出,该函数联合评估:输出的因果一致性与已验证的上下文图的匹配程度、智能体间的语义一致性,以及随时间的分布漂移。当检测到不稳定性时,一个基于回滚的自我修复机制会恢复已验证的上下文,阻止未受支持的片段传播。在自适应对抗威胁模型下,对500轮交互的实证评估表明:99.6%的轮次中上下文漂移保持有界,仅0.4%的轮次需要恢复;每轮效用高度集中(中位数-0.19,P05=-0.72,P95=0.30),严重退化(低于-1)仅占0.4%;在控制器层面没有注入攻击成功;选定输出的胜率稳定在98%以上;计算开销可预测,每token延迟为1.63e-3秒。

💡 推荐理由: 本文提出了一种新颖的基于博弈论的多智能体控制方法,在LLM长期对话中主动防御上下文投毒和提示注入攻击,填补了现有防御仅针对单轮输出的空白,对部署LLM应用的蓝队具有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Anindya Maiti

该论文针对网络审查规避系统的一个关键弱点——端点固定且可被发现——提出了移动目标规避(Moving-Target Censorship Resistance)的形式化理论。当前部署的规避系统(如VPN、代理)通常具有固定端点,审查者可以耐心枚举并封锁。移动目标规避系统通过快速轮换云端地址空间中的端点来对抗审查,但由于缺乏理论指导,轮换间隔和地址池大小往往依赖直觉。本文首次对移动目标审查规避进行了形式化建模,将审查者与防御者的交互视为一个连续时间下的定时博弈,作用域为组合地址域空间,并将经典FlipIt模型推广到具有附带约束的对手。作者证明了一个可持续性前沿(sustainability frontier),区分了审查者能够击败的配置和不能击败的配置。关键发现:在中国防火墙(GFW)2024年转向基于域名封锁QUIC和TLS的背景下,原始轮换速度并非约束因素;可用性受域名燃烧率(domain burn rate)β = λ_disc/λ_intro 支配,即审查者封锁防御者域名的速率与防御者引入新域名的速率之比。作者推导了闭式可用性定律,证明当β > 1时,无论端点轮换速度多快,仅靠地址轮换无法维持高可用性,并刻画了前沿β*。论文通过一个开放的、模型级别的审查者-防御者模拟器(无需特权访问或云部署)来验证分析,该模拟器在代表GFW、俄罗斯TSPU和伊朗的对手画像下复现了β*处的预测相变,并展示了对于状态依赖发现和突发性、提供商相关的燃烧的鲁棒性。该工作用精确的操作条件“保持域名经济领先于审查者”替代了启发式的“加速轮换”。适合阅读人群:网络审查规避系统开发者、网络安全研究人员、博弈论在安全中的应用者。

💡 推荐理由: 首次为移动目标审查规避提供形式化理论基础,揭示了域名燃烧率而非轮换速度是可用性的关键瓶颈,直接指导更有效的规避系统设计,对对抗大规模网络审查具有重要实践意义。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)
INFO
PAPER 2026-06-03

Bitcoin After Block Rewards

推荐 3.5
Conf: 50%
👥 作者: Junhyuk Lee

比特币的区块奖励计划逐步减半并最终归零,这引发了对其网络长期安全性的担忧:当矿工收入完全依赖交易手续费时,是否还能维持诚实挖矿的稳定性。本文基于序贯决策模型,分析了诚实矿工与偏离(如自私挖矿、空块攻击等)矿工的收益,推导出一个偏离阈值G_t,当实际条件低于该阈值时,诚实挖矿不再是矿工的私有最优策略。文章以2024年比特币减半事件为时间节点,利用实际链上数据验证了当前挖矿行为尚未出现大规模或结构性偏离,表明现阶段安全性尚可。然而,当区块奖励彻底消失后,即使交易费占比极低(如低于1%),G_t准则显示偏离可能成为理性选择。进一步,作者评估了三种协议级机制:基础费用(Base Fee)、费用下限(Fee Floor)和自适应最大区块大小规则,发现三者组合使用能显著提高偏离阈值,从而缓解纯费用机制下的激励崩溃问题。这些结论为评估比特币后区块奖励时代的安全性提供了量化基准,并对其他采用类似挖矿奖励机制的区块链(如莱特币、门罗币)具有参考价值。本文适合区块链协议研究者、加密货币经济学家以及安全工程师阅读,以预判未来网络攻击面并设计防御机制。

💡 推荐理由: 比特币是市值最大的加密货币,其安全性直接影响全球加密货币生态。本文首次系统分析了区块奖励归零后矿工可能偏离的触发条件,并提出了可落地的协议级缓解方案,对长期维护比特币网络安全具有重要参考意义。

🎯 建议动作: 研究跟进,评估自身管理的区块链网络在未来减半后的安全态势,并关注文中提出的三机制组合方案在社区中的讨论。

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Yuxin Liu, M. Amin Rahimian

该论文研究在不确定需求下的古诺寡头竞争市场中,竞争对手之间通过隐私保护渠道共享信息的激励机制。核心问题是:竞争性供应商是否愿意通过平台披露其私人信号?平台可以采用添加噪声的隐私保护机制,但噪声会降低信息效用。作者首先刻画了信息访问权与参与挂钩的基准设定。在没有外部信号的两企业市场中,无论隐私保护水平如何,企业都拒绝共享。但在 n 企业市场中,即使没有隐私保护,共享也可能发生,因为不参与者会失去对聚合信号的访问权。在此基础上,作者发现仅靠隐私保护不足以激励共享,必须同时存在一个信息量足够的外部信号。此外,拥有更准确私人信号的企业需要更强的隐私保护。论文通过博弈论分析,界定了共享可行域,并揭示了隐私设计与外部信息环境之间的互补关系。主要贡献在于为竞争环境下的隐私保护数据共享提供了理论基础,对平台设计、行业数据池构建等具有指导意义。适合关注数据经济、隐私机制设计的研究者和从业者阅读。

💡 推荐理由: 为竞争环境下如何通过隐私设计激励企业共享数据提供了理论基石,对数据共享平台、行业联盟的机制设计有直接指导意义。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.4)
推荐 8.5
Conf: 50%
👥 作者: Yuhao Li, Elaine Shi, Mengqian Zhang

本文研究自动做市商(AMM)机制设计中的三难困境。AMM是区块链上流行的去中心化交易模式,用户通过智能合约直接交易加密资产,但面临抢跑和尾随攻击(即矿工可提取价值MEV)导致的劣质价格。早期工作证明在共识层完全消除MEV不可行,因此近年研究转向应用层(智能合约)的机制设计。本文延续Chan、Wu和Shi等人的工作,研究一个自然的双资产AMM机制设计问题,他们提出的机制在底层区块链提供排序公平性的假设下,实现了令人惊讶的强激励兼容性(IC)。本文探讨同时实现IC、弱局部效率(wLE)和统一定价(UP)的可行性。wLE要求机制不应留下未满足的需求——只要用户的要价不过于严苛且订单可直接与池子执行;UP要求所有(部分)执行的订单必须以相同汇率交易。作者揭示了AMM机制设计的底层数学结构,主要结果可总结为一个三难定理:在IC、wLE和UP三者中,可以同时满足任意两个,但没有任何机制能同时满足全部三个。该研究为AMM设计提供了理论界限,有助于理解去中心化交易所的内在权衡。适合对区块链机制设计、博弈论和DeFi安全感兴趣的研究人员阅读。

💡 推荐理由: 该研究揭示了AMM机制设计中激励兼容性、效率与定价公平性之间的根本矛盾,为设计更优的去中心化交易所提供了理论指导,有助于安全从业者理解DeFi协议的内在风险与设计边界。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Juho Kim, Fei Fang, Tuomas Sandholm

本文首次研究了如何在完美信息扩展式博弈(如国际象棋)中对游戏代理的策略进行水印标记。受大型语言模型(LLM)水印技术(尤其是KGW方案)启发,作者提出了一种适应博弈场景的水印方法:在代理的策略中嵌入隐蔽信息,使得第三方可通过统计检验验证策略来源。该方法通过调整策略分布来嵌入水印,同时保证期望效用损失有界,但可检测性与策略质量之间存在权衡。实验在多种国际象棋引擎上评估,结果表明:水印对策略质量(如胜率)的影响可忽略不计,且仅需少量对局(例如5-10局)即可高置信度检测出水印。该工作为检测在线棋类游戏中的AI作弊(如未经授权使用强AI引擎)提供了技术基础,也拓展了水印技术在博弈领域的应用。核心贡献包括:形式化定义博弈代理水印问题、提出具体实现方案、理论分析效用损失界、以及实验验证有效性和低开销。

💡 推荐理由: 该研究填补了博弈代理水印的空白,为在线游戏平台(如国际象棋)反AI作弊提供了可操作的检测手段,同时为LLM水印技术向更广域智能代理安全拓展奠定了理论基础。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
推荐 3.5
Conf: 50%
👥 作者: Maryam Bahrani, Michael Neuder, S. Matthew Weinberg

该论文研究了区块链协议中一种新兴的设计模式:利用执行任务与验证任务之间的计算不对称性(例如,SNARKs 等密码学有效性证明需要证明者耗费大量计算,而验证者只需少量计算)。在这种模式下,协议需要在假名、对抗性环境中高效地征集昂贵任务的执行者。作者将这一问题形式化为一个机制设计问题:协议需要平衡“活度故障”(即任务未完成)的经济成本与为激励候选供应商(即节点)采取特定行为所需的支付成本。论文证明,最优协议的总损失随活度故障成本呈对数增长,且该损失会受到网络中恶意节点比例的放大。通过博弈论分析,作者发现最优均衡具有直观的结构,能够为实践者提供具体建议。例如,在许多场景下,最优设计是指定一个随机节点作为主要工作者(类似基于领导者的共识),同时由一个委员会作为后备。论文还刻画了负支付(即区块链中的罚没机制)在哪些渐进区域中特别有效。整体上,该工作为区块链中涉及计算不对称的任务采购提供了理论基础和设计原则。

💡 推荐理由: 该研究为依赖计算不对称(如SNARKs)的区块链协议提供了对抗环境下任务采购的机制设计框架,有助于预防活度故障和经济攻击,对zk-rollups、轻客户端桥等实际系统的安全设计具有指导意义。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Qi Tan, Yi Zhao 0011, Laizhong Cui, Qi Li 0002, Ming Zhu, Xing Fu, Weiqiang Wang 0002, Xiaotong Lin, Ke Xu 0002

该论文针对金融交易中的欺诈检测问题,提出了一种基于双人博弈的鲁棒检测框架。传统欺诈检测模型通常面临对抗性样本攻击和概念漂移的挑战,导致检测性能下降。作者将欺诈检测建模为检测器与攻击者之间的动态博弈过程:检测器试图识别欺诈交易,而攻击者不断调整策略以逃避检测。通过引入博弈论中的纳什均衡概念,论文设计了一种交替优化算法,使检测器在对抗环境中持续提升鲁棒性。实验在多个真实交易数据集上进行,结果表明所提方法在保持高检测率的同时,显著降低了攻击成功率,优于现有基线模型。该工作为金融安全领域提供了新的理论视角和实用工具。

💡 推荐理由: 金融欺诈检测是安全关键任务,该论文引入博弈论思想提升鲁棒性,对防御对抗性攻击具有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.6)
👥 作者: James W. Bono

该论文通过一个竞赛理论模型研究了AI增强的攻防投资博弈。攻击者和防御者在多个攻击表面上分配资源,其中攻击者的投资通过两个渠道发挥作用:无条件增强攻击能力,以及条件性削弱防御效能,从而产生一个随防御者自身投资而内生深化的“对手折扣”。作者推导出闭式军备竞赛比率,将攻防投资的相对边际有效性分解为六个结构性基元,并证明了在连续最佳反应动态下均衡的唯一性和全局收敛性。核心结果围绕信号互相关性——即一个攻击表面上的威胁情报对另一个表面检测的告知程度。当信号完全互相关时,军备竞赛比率与攻击表面数量无关:攻击者从表面扩散中获得的结构性优势被完全中和。在基准的完全稀释情形下(无互相关),每个表面的防御有效性随攻击表面增加而消失。扩展到异质性防御者面对按期望值攻击的攻击者时,模型指出双重无效率:私人防御的过度投资(零和转移外部性)和共享信号互相关的投资不足(公共物品)。这些形式化结果,结合基本模型之外的公共物品推理,刻画了在对抗性竞赛中集体信息聚合何时能够主导私人能力投资成为决定性因素。

💡 推荐理由: 该研究为理解AI时代网络攻防竞赛的结构性动力提供了理论基础,特别是揭示了信号共享与互相关性在抵消攻击者表面扩散优势中的关键作用,对防御策略制定具有指导意义。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)