#TRiSM 主题 - Cyber Security Daily Radar

👥 作者: Liam Kearns

该论文聚焦于基于代理的AI系统（agent-based AI）在医疗报告生成应用中的安全风险与缓解措施。通过将AI代理暴露给多个工具和资源，LLM能够自动化复杂任务，但为了提升功能和准确性，代理常被授予超出普通用户的权限，这可能导致数据泄露和法规违规。论文应用了AI信任、风险与安全管理（TRiSM）框架，将不安全的代理工作流改造为安全意识的代理工作流。作者针对医疗报告生成场景，设计了两种工作流（不安全 vs. TRiSM引导），并使用五种LLM（Claude Haiku 4.5, GPT-4.1-nano, GPT-4.1-mini, GPT-5.4-mini, Gemini 2.5 Flash）在两种报告类型上进行了评估，总计800次生成和500个攻击场景（包括RAG投毒、数据字段注入、客户端网络注入）。实验结果表明：TRiSM引导的代理工作流将RAG投毒的平均攻击成功率从31%降至10%，数据字段注入从42%降至25%，并通过服务器端提示构建完全消除了网络注入向量。此外，报告准确率从72.5%提升至86.5%（增加14个百分点），证明了安全设计能同时提高输出可靠性。论文的贡献在于展示了最小权限、深度防御的代理工作流可以改善安全性和准确性，同时强调了模型选择是架构中必要的考量因素。适合安全研究人员、AI开发者和医疗IT从业者阅读。

💡 推荐理由: 该研究将TRiSM框架系统性地应用于医疗AI代理，量化了安全加固带来的攻击率下降和准确率提升，为构建可信LLM代理提供了实证参考。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#TRiSM

Why Trust Your Agent? Empirical Security Gains from TRiSM-Guided Agentic Workflows in Healthcare