本文针对模型上下文协议(Model Context Protocol, MCP)服务器中普遍存在的描述-代码不一致(Description-Code Inconsistency, DCI)问题进行了系统性研究。MCP是大语言模型(LLM)调用外部工具的关键标准,其工作流程中,LLM依赖MCP服务器提供的自然语言描述来选择和执行函数。这一交互隐含地假设工具描述忠实反映底层实现,但实际中该假设并未得到强制验证。本文首先正式定义了DCI问题,并提出了一个全面的分类体系,涵盖功能不一致和未声明的副作用。基于该分类,开发了自动化框架DCIChecker,该框架结合结构感知的静态分析和直接-反向-仲裁(Direct-Reverse-Arbitration)提示方法,对工具描述与实际代码实现进行交叉验证。研究人员将框架应用于包含2214个真实MCP服务器中19200个描述-代码对的大规模数据集。测量结果表明DCI普遍存在,9.93%的对存在不一致。进一步分析显示DCI会造成关键防御盲区,可能引发从操作失败到隐蔽恶意行为等多种风险。最后,本文提出了强制语义一致性的缓解策略,以增强新兴代理生态系统的可靠性。该研究适合AI安全、LLM应用安全、软件工程等领域的从业者阅读。
💡 推荐理由: MCP是LLM调用外部工具的关键协议,描述-代码不一致可能被攻击者利用,导致LLM执行未预期的危险操作,是新兴AI供应链安全的重要盲区。
🎯 建议动作: 研究跟进