#url-detection 主题 - Cyber Security Daily Radar

👥 作者: Taeri Kim 0001, Noseong Park, Jiwon Hong, Sang-Wook Kim

本论文针对钓鱼URL检测中的规避问题提出了一种基于网络的方法。现有基于机器学习的检测方法容易受到攻击者的规避：攻击者可以通过使用良性域名、IP地址、URL字符串模式，或利用共享托管服务等方式伪装钓鱼URL，使其看起来像合法的。作者观察到攻击者的一些行为特征：例如，他们会重复使用钓鱼网页，选择便宜的托管商，以及使用共享托管以节省成本。受此启发，论文构建了一个URL关系网络，其中节点表示URL，边表示它们之间的关联（如共享同一IP、域名或托管商）。该方法的核心思想是：即使攻击者对单个URL进行规避，只要网络中大多数邻居节点没有被同时规避，该URL仍可被识别为钓鱼。实验使用了大规模真实数据集，与多种先进方法（包括基于特征的机器学习方法和现有的网络方法）进行了对比。结果显示，所提方法在F1分数（0.89）上显著优于最好的基于特征的方法（0.84），并且对各类规避策略具有鲁棒性。论文还分析了不同网络构建策略的影响，证明了基于多关系融合的网络能有效提升检测性能。该研究为钓鱼URL检测提供了新的视角，尤其适合安全运维团队和研究人员关注。

💡 推荐理由: 钓鱼攻击是网络入侵的常见入口，现有检测方法容易被规避，本研究提出了一种鲁棒性更强的网络化检测思路，有望提升实际防钓鱼效果。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Uche Unoke Emmanuel, Gideon Francis Oghie

该论文针对传统钓鱼URL检测方法（黑名单、规则匹配）对新出现的钓鱼URL反应迟缓的问题，提出了一种轻量级混合实时检测框架。框架结合黑名单预筛选与多层感知机（MLP）分类器，MLP仅利用URL的结构特征（如长度、域名层级、特殊字符统计等）进行分类，无需访问网页内容、调用第三方API或进行视觉渲染，大幅降低计算开销。模型基于PhiUSIIL数据集（含235,795条标记URL）训练，提取了16维轻量特征。实验结果显示，MLP分类器在准确率（99.24%）、精确率（98.74%）、召回率（99.95%）、F1分数（99.34%）和ROC-AUC（99.65%）上均优于随机森林、逻辑回归、XGBoost、LightGBM和CatBoost。混合架构下，单URL推理平均延迟仅1.2毫秒，并发处理峰值吞吐量达4,200 URL/秒。论文还开发了名为CyberGuard的原型桌面应用，验证了实际部署可行性。该工作证明，仅利用URL结构特征的轻量MLP模型即可在资源受限环境中实现高精度实时钓鱼检测，为终端设备或网络边界的安全防护提供了高效方案。

💡 推荐理由: 该工作展示了一种无需访问网页内容或第三方API的高效钓鱼URL检测方法，延迟极低，适合部署在网络网关或终端等资源受限环境，可实时防护。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.4)

Cyber Security Daily Radar

#url-detection

Phishing URL Detection: A Network-based Approach Robust to Evasion.

A Lightweight Hybrid MLP-Based Framework for Real-Time Phishing URL Detection Using Structural URL Features