兆芯在MWC上海聊CPU:Agent火了之后,CPU又站到了AI算力链条前排
作者周雅去年这个时候做CPU的公司多少有点“郁闷”。兆芯业务拓展副总经理陈晓旻在今年MWC上海展台交流时用了一个很直白的说法过去一段时间外界谈AI算力几乎都在看GPU。一台AI服务器里可能是1个CPU搭配8个甚至16个GPU。设备卖出去以后价值感最强的是GPUCPU在整套系统里的存在感并不高。但今年这个情况正在发生变化。原因众所周知AI的落地形态一直在变。从大模型训练到企业应用AI正在进入智能体阶段。陈晓旻把模型和智能体做了一个比喻“模型能力像发动机但发动机自己跑不起来。智能体做的事情是把发动机装成一辆车、一艘船、一架飞机让模型真正被用起来。而智能体本身现在更多跑在CPU上再由CPU去调用GPU的推理能力。”这让CPU回到大家重视的AI算力链条的前排。也是理解兆芯这样的国内自主算力厂商的关键。这次在MWC上海兆芯展示了很多产品包括全系列ZX86自主CPU以开先KX-7000桌面终端、开胜KH-50000平台高性能服务器以及全栈专属云、芯片级安全、GPU虚拟化加速等解决方案。/01/AI智能体带来CPU拐点但AI的算力系统一定是异构的Agent正热的时候国内AI圈热衷于“养马养虾”陈晓旻在交流中提及这个现象时说“智能体正在成为大模型落地应用和商业化之间最重要的桥。”因为大模型本身只是能力要把能力变成业务需要智能体来承接任务、调用工具、连接数据、执行流程。这件事到了企业市场里会进一步变复杂。陈晓旻说现在真正能商业化落地的AI主要还是ToB市场。企业用AI时不太可能把所有智能体都放在员工终端上跑。那样在管理、安全、权限、数据和运维上都会很难控制。更现实的做法是把智能体放到云端。运营商现在就在推动类似“云端智能体集群”的建设。智能体跑在虚拟机上、跑在后端由云平台统一管理。出现安全问题时也可以通过统一的安全策略处理。这就是CPU机会重新出现的地方。如果说GPU负责模型推理中的并行计算那么CPU负责的是更通用、更复杂的部分操作系统、虚拟化、云端调度、智能体运行、权限管理、安全策略以及对GPU算力的调用。所以智能体越多企业级AI越往云端走CPU的需求反而会增加。陈晓旻判断今年相对于去年CPU在算力系统里的配比肯定在好转。智能体对CPU是利好的甚至可以说是一个“拐点”。但他没有把这个拐点讲成一夜之间的爆发也不存在孰轻孰重对比。他的判断更接近产业链逻辑未来不管叫通算、智算还是科学计算本质上都会是异构系统。一个系统里会有 CPU、GPU、DPU、NPU甚至各种 XPU。不同任务分配给不同芯片只是比例会不断调整。在这个异构体系里CPU扮演着不可或缺的算力基座角色。/02/兆芯展台的第一层KH-50000作为服务器算力底座带着这条线再看兆芯展台最核心的产品是开胜 KH-50000服务器处理器。这是兆芯面向高端算力市场的旗舰服务器处理器采用自主微架构与 Chiplet 设计单颗最高 96 核384MB 三级缓存支持双路和四路扩展面向通信云平台、数据存储、AI 训练与推理等场景。围绕KH-50000兆芯联合多家生态伙伴展出了服务器、存储服务器和AI工作站。英政CS5280Z3系列服务器最大支持双路 KH-50000/96 处理器单机最高192核支持大容量DDR5 内存面向互联网、虚拟化、云计算、大数据和企业业务。联想开天 KR722z G3 是基于 KH-50000 的 2U 机架式服务器适配 5G 算力节点、云端资源池、虚拟化、云计算和大数据分析等场景。中兴 2U2S 通用服务器面向通信核心云和大数据分析强调计算密度、扩展能力、通信场景适配和安全可靠性。AS13000G7-460 存储服务器则面向海量通信数据存储适用于软件定义存储、分布式存储、云计算、大数据和数据库等应用。联硕弘道 2U 通用服务器面向通信云、数据中心、通用计算和虚拟化场景。昱格 YGT542-Z4 AI 工作站搭载 KH-50000支持 DDR5 内存、硬盘和 GPU 卡灵活扩展可用于 AI 开发、训练、推理和内容创作加速。这些展品共同说明一件事兆芯在证明KH-50000这颗CPU可以进入服务器、云平台、数据处理、存储和 AI 工作站这些更重的行业场景。/03/第二层从云笔记本到专属云CPU要进入运营商业务兆芯展台的第二层是面向运营商和行业客户的“从端到云”方案。其中最直观的是云笔记本。这次展会展示了五款ZX86平台云笔记本终端包括联想开天X5Z、X1、N8 Pro以及英政 CP300Z3、联硕弘道L5Z覆盖轻薄便携、高性能、长续航等不同定位。云笔记本的逻辑不是把所有算力都放在终端而是依托运营商云端的计算、存储和网络能力通过虚拟化技术把云端桌面呈现在终端上。对通信外勤、移动办公、政企集中办公来说这种模式的价值在于安全、统一管理、部署方便也能降低终端侧的维护复杂度。更往云端走是通信全栈专属云方案。兆芯联合中国移动、信投智科打造信创专属云以 KH-50000 服务器为核心算力底座依托移动云能力中心搭建 6400 核规模云平台提供信创验证、应用迁移、性能测试一站式服务兼容专属云、私有云、公有云等多种部署方式。陈晓旻在采访中透露兆芯与移动云、天翼云都有落地合作联通也在做适配调试。/04/第三层安全、数据和AI推理才是行业落地的门槛在展区陈晓旻还介绍了一个区域芯片级安全。他提到现在做信创认证往往必须满足商密要求。因此兆芯展示了芯片级安全解决方案围绕密码技术、可信计算、主动防御、安全虚拟化、机密计算和硬件安全增强等方向展开。根据官方资料显示兆芯全系自主 CPU 产品均通过国家商用密码检测认证支持 SM2、SM3、SM4、SM9、ECS、ZUC 等国密算法加速指令集及新型国密标准同时支持全内存加密、硬件漏洞防御、安全启动和可信计算等安全技术。此外兆芯还展示了与信投智科合作的语料加工和数据集系统。陈晓旻说现在大家谈 AI经常关注模型和算力但数据和语料同样重要。兆芯与合作伙伴用标准化、安全筛选过的语料建设高质量数据集平台底层同样基于兆芯CPU。另一个方向是与天翼云合作的安全AI推理底座。兆芯与天翼云围绕“AI安全”推进合作实现兆芯自主处理器与CTyunOS深度优化融合重点攻坚AI推理底座、Agent基础设施、操作系统智能化等技术面向政务、金融、教育、能源、交通、医疗、工业制造等关键行业打造联合方案。/05/第四层云电脑GPU虚拟化说明异构不是概念兆芯展台还有一个很典型的异构场景云电脑GPU虚拟化加速方案。这一方案基于兆芯双路 KH-50000 服务器平台搭配两块摩尔线程S3000全功能GPU及信创操作系统为每台云电脑提供高性能图形加速并支持物理 GPU 的弹性切分按需动态分配虚拟资源。它解决的是云桌面的现实痛点文稿演示卡顿、高清视频播放不流畅、3D图形渲染能力不足以及图片AI智能处理等创新应用对图形能力的要求。陈晓旻在采访中解释兆芯和摩尔线程提供的是底层CPU和GPU算力上层可以是云厂商的解决方案也可以是运营商自己的云桌面方案。这就是异构计算的一个具体例子。CPU 做通用计算、虚拟化、系统调度GPU 做图形加速和高并行任务上层云桌面方案把它们包装成用户可以直接使用的服务。未来 AI 也会是类似逻辑。/06/国产CPU的生态不可能靠一家企业完成在采访中当被问及与其他国产CPU厂商的竞争关系时陈晓旻的回答很有现实感。他强调“整个信创生态非常宽不可能只靠一家企业完成。”在他看来兆芯等国产CPU企业以及大量整机、操作系统、数据库、云服务和行业应用厂商共同构成完整国产生态。这也决定了国产CPU企业之间的关系不只是竞争。陈晓旻进一步指出“当然信创类企业毕竟是商业公司也会存在商业竞争。但如果从更大的产业视角来看几家国产CPU厂商首先要解决的是同一个问题国产CPU能不能在ToB、ToG、ToC 市场占据更大份额最终在更多应用场景中‘以国产芯片为主’。”在此目标还未达到之前国产CPU厂商之间更重要的是共同把生态做大。兆芯在官方资料中有一句表述可以作为注解“自主可控不封闭、兼容主流不依附”。资料写道“兆芯完整掌握处理器及其系统平台芯片研发设计的核心技术已自主建立完善的ZX86指令集方案通过系统构建ZX86自主指令集知识产权体系走出了一条‘自主可控不封闭、兼容主流不依附’的特色发展道路可确保后续CPU产品及应用全面自主迭代创新。”目前兆芯ZX86平台通信行业解决方案实现了云边端全栈覆盖。其中基于KH-50000打造的数据处理平台、安全AI推理底座落地运营商网络智能运维、内容审核等场景工作站产品落地多省广电核心运营场景云终端、GPU 虚拟化、云桌面等方案已在多家通信运营商、广电媒体规模化落地支撑云算力平台、融媒体中心、营业厅等场景核心业务运转。/07/下一步出海采访最后陈晓旻谈到国产CPU的长期发展。他认为“国产CPU走向成熟不会是某一个时间点突然发生的事更像新能源汽车产业一样是一个从量变到质变的过程。”新能源汽车不是靠一家车企突然超过海外品牌而是整个产业链不断成熟最终形成完整生态。国产CPU也一样需要芯片设计、制造工艺、整机、操作系统、应用软件、行业方案和市场环境一起进步。现在国产CPU在办公替代等场景已经相对成熟。但越往企业生产环境深处走改造难度越大。因为生产环境里有大量历史系统、行业软件、外设、数据库、业务流程和运维习惯。它不是换一台电脑那么简单而是整个生态和产业链的适配问题。陈晓旻也提到兆芯今年有一个重要目标从今年开始特别是在端侧CPU以及与AIGC相关的端侧 CPU 上尝试走向全球。一个方向是ToC市场。另一个方向是一带一路相关海外市场。他认为在很多海外市场客户不一定总是使用最先进技术兆芯的能力有机会满足当地应用需求。兆芯目前已经有一些可公开的出海案例。这段话言简意赅但具备参考性。长期来看国产CPU不能只依靠政策和信创项目它需要进入更市场化的客户场景用性能、成本、兼容性、稳定性、生态和服务去说服用户。这条路会更难但也更健康。