告警到修复全自动!阿里云发布 Agentic Skills,打造 AI Native 研发运维闭环
6 月 25 日阿里云飞天发布时刻发布阿里云 Skills 官网以 Agent 为新的操作主体重构云能力的统一调用入口。阿里云可观测体系作为阿里云核心服务之一在 Agent 友好化方向上率先迈出关键一步。阿里云将云监控 CMS、日志服务 SLS、应用实时监控服务 ARMS、全域智能运维平台 STAROps 的核心能力封装为 Agentic Skills让 Agent 可以直接调用可观测能力。本次发布会上云监控 Skills、STAROps Skills 作为首批 Agentic Skills 正式上线。开发者在 Qoder 等 Agent 客户端中发出一句自然语言指令Agent 即可自主完成数据接入、告警配置、根因诊断并联动研发工具链完成代码修复与发布。首批发布基于 Skill 的全栈可观测与智能诊断本次发布会上阿里云智能高级技术专家张城重点演示了云监控 Skills 和 STAROps Skills 驱动的全域可观测与智能诊断实践云监控 Skills把告警配置、数据接入等高频运维动作封装为 Agent 可直接调用的标准指令。云监控支持上百种云产品以及移动端、小程序、多语言应用、大模型、Agent 等多端全栈场景的数据接入Skills 让这些能力以自然语言方式被调用。STAROps Skills把健康度诊断与根因定位能力开放给 Agent 客户端调用支持持续对话与多轮追问。这套 Skills 体系为企业提供了一条从存量监控体系平滑过渡到 Agentic Ops 的路径既支持在现有工作流中嵌入 AI 提效也支持企业为关键业务构建 Agent 原生的诊断模式全栈数据覆盖云监控一站式接入云产品、移动端、小程序、多语言应用、大模型、Agent 等全栈对象的指标、链路、日志、事件数据。运维数字孪生UModel 对采集到的数据做语义化建模对各类 IT 资源、业务资源进行本体化建模打通跨域对象。智能诊断与运维STAROps 基于大模型完成多维数据分析、告警实时诊断与根因推理给出可追溯到代码变更的根因结论并提供恢复建议。Agent 友好STAROps 提供适合大模型调用的 API 与 CLISkills 内置参数 Schema 与多重校验逻辑确保 Agent 生成的配置项字段合理避免误配。应用实战AI Native DevOps 全链路闭环Qoder 作为研发侧统一入口调用云监控 Skills、STAROps Skills 与云效 MCPUModel 实现研发域与运维域的跨层数据打通。基于这套架构编码→发布→告警→诊断→修复形成全链路闭环编码开发者在 Qoder 中编写代码。发布Qoder 通过云效 MCP 触发云效平台的代码提交、流水线构建与镜像产出镜像推送至容器镜像服务由容器服务K8s 集群拉起客户应用。告警云监控 Skills 为应用、容器、镜像配置数据接入与告警规则线上异常即时触发。诊断告警触发后Qoder 调用 STAROps Skills借助 UModel 的跨域关联从指标异动追溯到 Deployment 变更、再回到具体的代码发布与提交人给出结构化根因。修复Qoder 直接生成修复代码通过云效 MCP 在 Codeup 上发起 Pull Request合并请求自动附带问题背景与根因分析进入 Review。最佳实践从告警配置到问题修复告警配置告警配置是开发者高频重复的运维操作之一。云监控 Skills 可在 Qoder 等 Agent 客户端通过一条命令完成安装。在 Qoder 中下达“为这个集群配置 CPU 告警”的指令Agent 会基于 Skills 自动拆解为告警规则配置、Webhook 通知设置等子任务由 Skills 内置的 Schema 与校验逻辑保障字段配置的合法性。点击此处查看视频https://mp.weixin.qq.com/s/hMtxbnk8JibX_UVGKanQVw告警诊断当线上告警触发时开发者可将告警信息直接输入 Qoder结合 STAROps Skills 快速完成根因诊断给出初步的根因判断。由于 STAROps 具备 Agent 原生的交互能力可继续追问“这次问题由哪次发布引起”。因为接入了云效 DevOps 数据Agent 能诊断出具体哪次发布引入了问题、关联的流水线执行情况、发布时间与监控指标变化的关联性最终给出综合性的根因结论。代码修复当所有现象和根因都已明确后Qoder 直接修复相关代码通过云效 MCP 在 Codeup 上发起 Pull Request请求中自动附带问题背景、根因分析与修复说明。点击此处查看视频https://mp.weixin.qq.com/s/hMtxbnk8JibX_UVGKanQVw云监控 Skills、STAROps Skills 现已上线阿里云 Skills 官网可在 Qoder 等 Agent 客户端一键安装。通过将监控、诊断、研发工具链以 Skills 和 MCP 的形式开放给 AI Agent阿里云让“告警 - 定位 - 修复 - 发布”这条原本需要多人协作、跨平台操作的链路可以在同一个 Agent 对话界面中端到端完成全面提升了运维效率让研发和运维之间的协作更加顺畅、智能。立即体验https://skills.aliyun.com/skills?categorymiddlewareorderByinstall