智谱GLM-5.2实测,一部黑洞诞生动画之后,我认真考虑换掉Claude了
最近智谱发布了最新的旗舰模型GLM-5.2。主打AI编程和Agent100万token上下文MIT协议完全开源。我用了这几天一句话总结GLM-5.2无限接近Opus 4.6。国产模型里写代码最能打的一个。而且这次智谱还配套发了自研编程工具 ZCode 3.0。打开的一瞬间我就乐了。这不就是Codex吗撞脸撞到这个份上也算是像素级复刻了。。。不过有一说一ZCode 这波进步是真不小。今年1月份的时候我使用过ZCode 1.0当时的感受是一个把Claude Code几个命令行整合到一起的壳子用着没什么特色也没什么记忆点。但3.0完全不是一个东西了。从内核到UI全部重写自研Agent内核搭配自家的GLM-5.2长程推理、工具调用做了端到端优化。整个体验非常丝滑。今年国内大厂都在疯狂卷 ADE就是AI原生开发环境。字节的Trae、阿里的Qoder、腾讯的CodeBuddy都已经跑了一段时间了。智谱之前在这块一直是缺位的ZCode 3.0算是正式补上了这个短板。而且补得还不错。体验已经能跟前面几家正面硬刚了。夸归夸该吐槽还是得吐槽。GLM-5.2的发布是一次非常仓促的亮相。没有基准测试分数。没有API。你唯一能体验到这个模型的方式就是买他们的Coding Plan套餐。所以。为什么要这么急呢我觉得有两个原因。第一个原因上周Claude的前沿模型Fable 5被美国政府下架了。整个AI圈一片焦虑。智谱在这个节骨眼上站出来说了一句「前沿智能不应只属于少数人也不应被少数规则随时收回」。不管背后有没有商业考量这句话在那个时刻是有分量的。第二个原因竞争对手Kimi同一周发了2.7口碑还不错。两头一挤就有了仓促发布。我决定用三个实验来测试一下它的实力。三个实验一个比一个猛。先来第一个做个游戏。做了一个Flappy Bird飞行躲避游戏但必须是中国水墨画风格。一只水墨画的仙鹤在山水画卷中飞行躲避障碍。要求是单个HTML文件。第一版跑出来游戏的交互逻辑是对的整套玩法没有问题。但我看到那只「仙鹤」的时候。。。不是哥们这是鸡啊而且整个游戏没有任何音乐和音效玩起来特别干巴就像一个没有灵魂的技术demo。但这恰恰体现了AI做编程的特点逻辑层面能做得很好但美学层面需要你去调教。于是我告诉它你要把仙鹤画得像一只鹤另外加上中国风的音乐。半个小时后GLM-5.2交出来第二版。游戏名叫「墨鹤」有意境。这只鹤是真的像鹤了。最让我没想到的是音乐。它实时合成了一整套中国风配乐。更骚的是音乐的节奏会跟着你的分数走。分数越高音乐越急促你的心跳也跟着加速。这种细节的完成度说实话已经超出了我对AI生成游戏的预期。仙鹤游戏说明GLM-5.2的理解力和执行力都是在线的。但游戏毕竟是游戏逻辑相对清晰。接下来第二个实验我想试一个更考验「美感」的东西。第二个实验中国风水墨流体。我之前看到有人用Fable 5做了一个交互式的墨流网页。整个体验让人想盯着看半个小时。我就想让GLM-5.2来做中国风的水墨丹青。这个实验跟游戏不一样。游戏考验的是逻辑和结构水墨流体考验的是模型懂不懂「美」。结果第一版又翻车了。打开之后画面是有了宣纸质感的背景也有了但你怎么点怎么拖屏幕上就是出不来任何墨点。完全没有晕染效果。明显是个半成品。流体模拟的底层代码可能没写墨水的注入逻辑也没有跑通。我跟它反馈了问题第二版出来之后效果就对了。你点击屏幕的时候墨滴会慢慢晕开。边缘会有轻微的渗透暗化模拟了墨水在纸上的渗透效果。拖拽的时候墨色被水流拉出流线和漩涡。配色用的是传统东方色系墨、蓝、朱、松、金五种颜色可以切换。说真的作为两轮迭代的产物这个完成度已经相当不错了。但如果拿它跟Fable 5做的那个版本做对比差距还是能感知到的。交互的丝滑程度差了一截拖拽的时候墨色的跟随感没有那么灵敏。墨韵的层次也没有那么飘逸。GLM-5.2做出了效果但是没有做出灵气。最后一个实验放大招。黑洞的诞生。前几天Fable 5发布的时候黑洞模拟是全网做得最多的AI Coding测试。引力透镜、旋转的吸积盘、幽暗的事件视界全部在单个HTML文件里用Three.js实现。但我不想做一个静态的黑洞。我想搞个更有野心的让GLM-5.2把黑洞的「诞生过程」做成一部电影。从一颗红超巨星开始经历引力坍缩超新星爆发最终形成黑洞。可能是我的要求太高了。这个实验可是把GLM-5.2折磨坏了。第一版它只给我做了一个最终态的黑洞。整个「诞生过程」完全没有。