Text2SQL已经不新鲜,让AI真正会搭数仓才是关键
过去一年很多数据团队已经开始用 AI 辅助写 SQL。让 AI 写一个 SELECT、补一段 ETL、解释一个报错并不稀奇。真正困难的是当你要搭一条能进生产的数据链路时AI 能不能理解数仓分层、增量计算、调度依赖、权限边界、性能和稳定性这正是云器 ClickZetta cz-cli 想解决的问题。cz-cli 是 ClickZetta Lakehouse 的 AI-Agent-friendly 命令行工具。它不只是让你在终端里执行 SQL而是把 Lakehouse 的操作能力、工程规范和专业场景封装成 AI 可以直接使用的专业能力。它有两种用法第一种是作为 Cursor、Claude Code、Codex 等 AI coding agent 的数仓工具让外部 AI 工具直接操作 Lakehouse。第二种也是很多团队更容易上手的方式是直接使用 cz-cli 自带的数据开发 Agent通过cz-cli agent命令打开一个面向数据开发的专业 Agent不依赖任何其他 AI agent也能用自然语言完成数据开发、链路搭建、质量巡检和任务运维。快速上手安装curl -fsSL https://cz-cli.ai/install.sh | bash配置连接cz-cli setup启动cz-cli agentcz-agent //或者 cz-cli agent想了解更多安装细节和配置选项可以前往 cz-cli 说明文档。https://www.yunqi.tech/documents/cz-cli从一个业务场景说起假设你在一家连锁零售公司业务团队每天都要看门店经营数据订单金额、会员复购、商品库存、门店小时级销售趋势。原始数据分散在订单系统、库存系统、会员系统里每天都在持续变化。传统做法通常是这样的数据工程师先建 ODS 原始层再清洗到 DWD 明细层最后加工 ADS 指标层中间还要考虑增量同步、字段标准化、调度任务、失败重试、质量校验。业务方一句“我想看门店小时级经营看板”落到工程上可能就是几天工作。现在换一种方式。你只需要把需求说清楚帮我搭建一个门店经营分析数仓。订单数据持续写入要求按标准 ODS/DWD/ADS 三层设计。ODS 保留原始订单DWD 清洗出门店、商品、会员、支付时间等字段ADS 输出门店小时级销售额、订单数、客单价、会员复购指标。链路要支持增量更新避免每天全量刷新并配置定时调度和基础校验。这个需求既可以在 Cursor、Claude Code、Codex 里交给 AI也可以直接交给 cz-cli 自带的 Agentcz-cli agent run 帮我搭建一个门店经营分析数仓。订单数据持续写入按 ODS/DWD/ADS 三层设计ADS 输出门店小时级销售额、订单数、客单价和会员复购指标链路要支持增量更新并配置定时调度和基础校验。接下来Agent 会通过 cz-cli 直接操作 Lakehouse创建 schema、建表、写 ETL SQL、配置任务、执行验证查询。它不是凭空生成一段“看起来像 SQL”的文本而是在真实环境中一步步执行并根据返回结果继续修正。更关键的是它知道该怎么做增量。对于持续写入的订单数据AI 可以判断是否适合使用 CDC、Table Stream 或 Dynamic Table。比如 ODS 层开启变更追踪用 Table Stream 捕获新增订单驱动 DWD 层增量清洗ADS 层用 Dynamic Table 维护门店小时级聚合让指标随底层数据变化持续更新。这和“让 AI 写一段 SQL”完全不是一回事。这里的 AI 做的是工程决策哪些表需要保留原始数据哪些字段需要标准化哪里适合增量消费哪里应该做聚合刷新任务跑完后如何验证结果是否合理。CZ-CLI 的价值不只是命令行很多数仓 CLI 的价值是把 UI 操作搬到终端。cz-cli 更进一步它的设计目标是让 AI 能可靠地操作数仓而且不限定 AI 来自哪里。如果你已经在用 Cursor、Claude Code、Codexcz-cli 可以成为它们的数据工程工具箱如果你不想切换到外部 AI IDEcz-cli agent 本身就是一个专业的数据开发 coding agent。你可以把它理解成一个“随叫随到的数据工程搭档”它既懂 Lakehouse 命令也懂数仓任务应该按什么步骤建设。首先它有 AI 友好的输出。cz-cli 默认返回结构化结果错误信息也会带上清晰的上下文和修正提示。对人来说这是更容易排查对 AI 来说这是能否自动纠错的关键。其次它覆盖了数仓开发的完整生命周期SQL 执行、schema/table 管理、任务创建、调度发布、运行记录、attempt 日志、job 详情、profile 多环境管理。AI 不需要在 Web UI、SQL 客户端、调度系统之间来回跳转而是可以通过统一入口完成端到端操作。最重要的是专业场景能力。cz-cli的数仓skills让外部 AI coding agent 获得批量同步、CDC 实时同步、Kafka 接入、OSS 导入、动态表、Table Stream、数据恢复、权限管理、性能分析、知识库构建等技能而cz-cli agent则把这些能力直接内置到 cz-cli 自己的对话式开发体验里。它们不是零散命令而是一套“知道该按什么步骤做”的工作流。很多数仓 CLI 的价值是把 UI 操作搬到终端。cz-cli 更进一步它的设计目标是让 AI 能可靠地操作数仓而且不限定 AI 来自哪里。如果你已经在用 Cursor、Claude Code、Codexcz-cli 可以成为它们的数据工程工具箱如果你不想切换到外部 AI IDEcz-cli agent 本身就是一个专业的数据开发 coding agent。你可以把它理解成一个“随叫随到的数据工程搭档”它既懂 Lakehouse 命令也懂数仓任务应该按什么步骤建设。首先它有 AI 友好的输出。cz-cli 默认返回结构化结果错误信息也会带上清晰的上下文和修正提示。对人来说这是更容易排查对 AI 来说这是能否自动纠错的关键。其次它覆盖了数仓开发的完整生命周期SQL 执行、schema/table 管理、任务创建、调度发布、运行记录、attempt 日志、job 详情、profile 多环境管理。AI 不需要在 Web UI、SQL 客户端、调度系统之间来回跳转而是可以通过统一入口完成端到端操作。最重要的是专业场景能力。cz-cli的数仓skills让外部 AI coding agent 获得批量同步、CDC 实时同步、Kafka 接入、OSS 导入、动态表、Table Stream、数据恢复、权限管理、性能分析、知识库构建等技能而cz-cli agent则把这些能力直接内置到 cz-cli 自己的对话式开发体验里。它们不是零散命令而是一套“知道该按什么步骤做”的工作流。所以当你让 AI “把 MySQL 订单库同步到 Lakehouse”它不应该只生成一段建表 SQL而应该继续判断这是单表同步还是整库同步要全量加增量还是只做增量目标表是否存在字段类型怎么映射任务是否需要调度是否会影响生产链路cz-cli 的核心价值就在这里让 AI 从“代码补全工具”变成“懂数仓的工程搭档”。这个搭档可以运行在你熟悉的 AI IDE 里也可以直接运行在 cz-cli 自带的 Agent 里。对数据工程师少踩坑少返工数据工程师最怕的不是写 SQL而是那些重复但容易出错的细节字段注释漏了分区没按规范建增量 offset 语义理解错了调度配了但没验证开发环境和生产环境 profile 搞混。cz-cli 可以把这些动作标准化。你仍然负责业务建模和工程判断但大量执行层细节可以交给 AI编写任务、执行、验证、修正。尤其在 CDC、Table Stream、Dynamic Table 这类有平台特定语法和语义的场景里价值会非常明显。它也不是鼓励“无脑让 AI 上生产”。恰恰相反cz-cli 的 profile、结构化错误、写操作控制、任务发布流程都是为了让 AI 操作有边界、有反馈、有审计路径。其他场景也能自然延展除了数据工程师搭 pipelinecz-cli 对数据分析师也很有用。分析师可以用 cz-cli 查询数仓再让 AI 基于查询结果生成 HTML 分析报告或可视化页面把“取数到交付”的链路缩短。对业务用户来说cz-cli agent run 这类自然语言入口可以把一些日常探索变得更直接查看某个 schema 的表、统计核心指标、生成一次数据质量巡检报告。业务不用等待完整 BI 数据集排期也能先把问题问出来。对于没有安装 Cursor 或 Claude Code 的团队这一点尤其重要只要有 cz-cli就已经有了一个可用的数据开发 Agent。对运维场景cz-cli 还可以查看任务运行记录、attempt 日志、job 执行详情辅助做失败诊断、性能分析和回填操作。AI 时代的数据工具不应该只问“能不能生成 SQL”而应该问“能不能把一条数据链路正确、安全、规范地搭起来”让 AI 真正懂数据工程。cz-cli既能把 ClickZetta Lakehouse 的能力开放给 Cursor、Claude Code、Codex 等外部 AI coding agent也能通过 cz-cli agent 直接提供一个开箱即用的数据开发 Agent。再加上专业 skills 对复杂场景的沉淀AI 不再只是帮你写 SQL而是能参与完整的数据工程流程。当业务需求从“帮我写个查询”升级为“帮我搭一条近实时数仓链路”cz-cli 的价值就会变得非常具体少手写少踩坑把时间还给真正重要的业务指标、数据模型和工程质量。现在就开始使用cz-cli吧访问cz-cli网站了解更多信息https://cz-cli.ai/安装 cz-clicurl -fsSL https://cz-cli.ai/install.sh | bash配置连接并验证cz-cli setup获取cz-cli安装文档请访问https://www.yunqi.tech/documents/setup_cz_cli更多cz-cli使用技巧请点击预约今晚1930直播云器科技官网 - 改变数据的使用方式更多内容欢迎关注「云器科技」官网云器科技-多云及一体化数据平台提供