Semgrep 实验：GLM 5.2 开源低价，在 IDOR 检测中性价比跑赢前沿编程助手！-尧图建网站

Semgrep 团队将 10 个大模型和编程助手投入 IDOR 检测基准测试结果显示智谱 AI 的 GLM 5.2 以开源、低价优势裸跑 F1 达 39%性价比亮眼。IDOR 漏洞揭秘IDOR 即不安全的直接对象引用是一种“缺失型漏洞”。如示例代码虽无危险调用和注入点但未检查登录用户身份修改 URL 数字就能获取他人数据检测这类漏洞颇具难度。测试结果大比拼Semgrep 实验中裸跑的 GLM 5.2 拿到 39%的 F1Claude Code 两次运行分别为 37%和 28%OpenAI 的 Codex 20%DeepSeek V4 垫底 17%。而 Semgrep 自家多模态管线配 GPT 5.5 排第一F1 达 61%。GLM 5.2 优势凸显GLM 5.2 于 6 月 13 日发布四天后开源全部权重。其架构为 MoE总参数量约 7500 亿上下文窗口提升。它成本低找到一个真实漏洞成本仅 0.17 美元约为同类前沿模型的六分之一。实验结论启示Semgrep 团队总结脚手架比模型重要给模型搭脚手架性价比更高开源权重模型裸提示词能在推理型安全任务上击败前沿编程助手大模型经济学与模型能力同等重要成本优势影响工具选型。实验局限性与建议该实验是单任务、单数据集、单次运行IDOR 检测非确定性换漏洞类型结果可能不同。但指向明确做代码安全产品应更好利用已有模型选模型做安全任务GLM 5.2 因性价比值得关注。编辑观点GLM 5.2 在 IDOR 检测中的表现让我们看到开源模型的潜力。未来代码安全领域或更注重模型性价比开源模型有望迎来更多机会。

相关新闻

中小制造商需要的AI算力解决方案

开源文件同步软件 FreeFileSync 14.10 版更新：添加校验、修复错误、更新依赖

第 24 篇：CSS Animation 关键帧动画 —— 纯 CSS 实现自动动效，摆脱定时器依赖

最新新闻

IntelliJ IDEA 之简介

智慧树学习自动化助手：3步解放你的在线学习时间

Claude 3.5 Sonnet模型解析：轻量级AI推理的性能与成本平衡

系统重装——PE系统

行为型模式：对象之间的默契配合

3个步骤解锁浏览器画中画魔法：重新定义你的多任务工作流

日新闻

如何在1分钟内为Windows安装苹果USB网络共享驱动：完整解决方案

专业级Windows系统优化工具：WinUtil一站式自动化解决方案

液冷板焊接的能耗账：钎焊炉一年200万度电，激光产线只花十分之一

周新闻

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

月新闻