AI制品Registry与发布门禁
AI 制品 Registry 与发布门禁 返回 07-README ⬅️ 10-Eval集治理 ➡️ 08-可观测定位Agent 平台「发布 Gate 画什么」——把 model / prompt / tool schema / KB 索引四维版本收成可回滚的 Registry并与 Gateway、Obs、Eval 串联。Eval 流程见 10Gateway 租户见 07-GatewayML 侧 Model Registry 见 ml-platform/04。L1 · 是什么1.1 一句话定义AI 制品 Registry Agent 应用的配置与知识制品的单一事实来源SSOT每次生产流量都能回答「当时跑的是哪四代 artifact」每次发布都是代码 四维 artifact eval 报告的原子绑定。1.2 四维版本矩阵Staff 必背维度制品示例典型存储回滚粒度Modelgpt-4o-mini2025-11、LoRA adapter idModel Registry / Gateway 路由表路由权重Promptsystem tool 指令模板Langfuse Prompt / Gitprompts/标签prod指针Tool schemaOpenAPI / JSON Schema / MCP manifestGit 契约测试schema semverKB / 索引向量 collection aliaskb_v12Milvus alias / ES index alias蓝绿别名切换AI Artifact Registrymodel_refprompt_reftool_schema_refkb_index_refRelease Recordeval_set_refAI GatewayAgent RuntimeTrace/Span与 DevOps 差异传统发布 Gate 代码 配置Agent 发布 Gate 代码 四维 eval_setsha13 §11。1.3 平台一张图架构师白板观测 质量数据面控制面passArtifact RegistryPolicy OPABudget / QuotaAI GatewayAgent RuntimeRAG / ToolsLangfuse / OTelEval HarnessGit PR口播顺序Registry 在控制面Gateway 注入tenant_idrelease_idTrace 必须带release_id才能做按版本归因08。L2 · 各维 Registry 设计2.1 Model Registry与 ML 平台分工职责llm-agent 侧ml-platform 侧权重 artifact、训练 lineage引用主责ml-platform/04路由别名smart/fastGateway 配置07同步审批流量化/AWQ 包Serving 03模型卡Agent 架构师只需讲清边界自研小模型走 ML Registry商用 API 模型走 Gatewaymodel_list 合同版本号不必进 Kubeflow。2.2 Prompt Registry能力实现版本Git tag 或 Langfusepromptname version环境指针prod/staginglabel实验A/B 绑定prompt_ref在 release record审计diff 进 PR禁止生产 UI 直改无记录Spring AIL1PromptTemplate 外部化观测 span 写gen_ai.prompt.name/ versionSpring AI Observability。2.3 Tool Schema Registry风险门禁破坏性改参schemasemvermajor bump 阻断越权工具暴露MCP manifestRBAC绑定循环调用max_calls在 registry 元数据# tools/refund_api/v2.1.0.yamlname:refund_apiversion:2.1.0risk_level:writeidempotency:requiredhitl:requiredschema:type:objectrequired:[order_id,reason_code]MCPL3Model Context Protocol — Server 声明 toolsClient 以 registry 为准做 allowlist。2.4 KB / 向量索引 Registry模式说明Alias 切换kb_current→kb_v12保留kb_v1124h 回滚影子索引kb_v13_shadow跑 eval 再切别名nlp 03§14dict_version分词词典与 chunk 管道绑定nlp 08L3 · 发布门禁Release Gate3.1 Release Record不可变{release_id:rel_2026_05_28_001,git_sha:a1b2c3d,artifacts:{model_ref:litellm:smartgpt-4o-mini-2025-11,prompt_ref:cs_main7,tool_schema_ref:tools_bundle2.4.0,kb_index_ref:kb_alias:v12},eval_set_ref:golden_cssha9f3a…,eval_report_uri:s3://eval/rel_001/report.html,approvers:[tl_ai,compliance_bot],canary_percent:5}3.2 门禁流水线契约测试 tool schemaGolden Harness安全红队抽样成本回归人工审批高风险Canary全量阶段阻断条件C1schema 破坏性变更无 migrationC210 阈值C3注入成功率 0C4$/case 5% 无业务审批C5risk_levelwrite无 HITL 证明3.3 回滚矩阵预演劣化信号第一动作第二动作faithfulness↓kb alias回 v11prompt 回 v6成本↑Gateway 路由切 fast缩 context工具错误↑tool_schema回滚禁用新 MCP Server延迟↑关 rerank缩 max_tokens原则一次只回滚一维便于归因13 §11。3.4 多租户字段用途tenant_idRegistry namespace 隔离release_id租户可不同 prompt/KBmodel 可共享缓存键hash(tenant, prompt, prefix)— 禁 cross-tenant07-GatewayL4 · FinOps 与 DR横切4.1 FinOps 标签与 Registry 绑定每次 span / billing 记录tenant_id, feature, release_id, model_ref, prompt_ref$/successful task 成本 / 任务成功数非 HTTP 200。超预算 → Gateway 降级fast或拒答03-Serving §10。4.2 灾备向量 Checkpoint MCP组件RPO/RTO 要点向量库跨区副本 alias 指向 DR collectionCheckpoint DBPostgres与 13 §9.4 一致MCP Server多副本 熔断Client 缓存 manifest 版本Staff 一句Agent DR 状态可恢复 知识可回滚 工具可降级不是只备份模型权重。L5 · Staff 答辩5.1 STAR-M-P误发 prompt v8 承诺赔偿要素内容S新 prompt 上线 2h合规告警「保证赔偿」词频 ×8T30min 止血24h 根因Arelease_id定位 prompt8Langfuse 一键prod→v7Golden 加 10 条诱导承诺Gate 加forbidden_substringsM无release_id无法快速归因P承诺类拦截 100%后续 PR 必绑 eval_report5.2 大厂追问答Q1 · Registry 放 Git 还是平台答Prompt/Tool schema/KB 管道配置 → Git可 diff运行时指针 → Registry 服务Langfuse label / 内部表。模型路由在Gateway。Q2 · 四维都要一起发布吗答不必。KB 日更、prompt 周更、model 月更——但Release Record 必须记录当前组合Canary 时只动一维。Q3 · 和 Feature Store 关系答Feature Store 供路由/策略特征用户风险分→选模型Registry 管生成制品。Agent 用实时特征选 release 变体时在 Gateway 打feature_flags交叉 ml-platform/01。Q4 · 低代码 Dify 怎么纳入 Registry答Dify 导出workflow YAML prompt 快照进 Git生产切 Spring AI 后同一 release_id贯穿上15-Dify。Q5 · 如何证明「可审计」答任意trace_id→release_id→ 四维 ref eval_report approver资金类再加 tool args hash17-安全 §审计字段。5.3 Agent 平台演进分期对齐27阶段Registry 能力典型团队规模L0Git prompt 手工 KB5 人L1Langfuse prompt eval 绑定5–20 人L2统一release_id Gateway 路由20–50 人L3多租户 chargeback 自动回滚50 人 / 多 BU口播大多数「Agent 架构师」面试答到L2即可L3 讲 FinOps 与 DR 加分。5.4 与08 电商 Prompt Registry 图衔接域内08§10 已画Prompt Registry Canary——本篇补齐Release Record 字段级契约与四维联合回滚实施时同一release_id写入 Langfuse trace 与 SpringObservation。5.5 合规字段发布审计最小集字段说明release_id不可变approver高风险双人eval_set_ref绑定 Golden shachange_summary人类可读rollback_target上一稳定release_iddata_snapshot_idKB 管道批次可选5.6 与 ml-platform 联合发布表格 ML LLM变更类型ML RegistryAI Registry重排模型 v3✅ 主 Gate引用model_refPrompt v9—✅ 主 GateKB 索引 v12特征无变✅ alias 切换实验策略05 AB互斥层绑定release_idAgent 路由特征如风险分→选模型特征定义仍在 Feature Storerelease 变体在 Gateway 配置表两者在release_id上汇合。5.7 面试白板模板5 分钟画四维release_id画PR → Harness → Canary → 全量写回滚先 KB 后 prompt点trace 归因字段提多租户缓存隔离§8 样例 Release 与回滚剧本可背诵8.1 当前生产指针示意{prod_pointer:{release_id:rel_2026_05_20_stable,artifacts:{model_ref:litellm:smartazure/gpt-4o-2025-11,prompt_ref:cs_main6,tool_schema_ref:tools_bundle2.3.0,kb_index_ref:kb_alias:v11},eval_set_ref:golden_cssha8a2c…,canary:{percent:0,target_release:null}}}8.2 回滚剧本逐步口播步骤动作验证1告警faithfulness -1.2pp / 1h.dashboard2查release_id分布 → 锁定rel_2026_05_28_001Langfuse3仅回滚kb_index_refv11→v10cite 恢复4仍劣化 → 回滚prompt_ref7→6停止 Canary5复盘eval 为何未拦补 Golden108.3 Canary 检查表SRM分桶比例 5/95 偏差 1%护栏合规事故 0代理指标转人工率、拒答率主指标CSAT延迟 48h 再看§9 FinOps Chargeback与 span 对齐标签账单维度表示例tenant_idBUbu_electronicsfeature产品checkout_assistrelease_id版本实验rel_*model_ref模型成本gpt-4o-mini$/successful task 周期内 token 成本 / 成功结束会话数与 08 一致。§10 与 98 口播映射G06–G08ID章节G06 四维矩阵§1.2G07 Release Record§3.1、§8G08 回滚顺序§3.3、§8.26. 面试前 Checklist白板四维矩阵 Release Record JSON讲清Registry / Gateway / Runtime / Obs分工列回滚矩阵四行区分ML Model Registry vs API 路由多租户缓存键与 release 隔离DR 三角向量 / checkpoint / MCP7. 导航关联路径Eval 治理10-Eval集治理Gateway07-AI-Gateway可观测08-可观测Playbook §1113七视图27工业级96官方文档与源码一级依据写作规范docs/official-sources-registry.md §0L1 · 官方文档Langfuse — Prompt ManagementLiteLLM — Proxy ConfigSpring AI — ObservabilityModel Context Protocol SpecificationL2 · 官方源码langfuse/langfuseBerriAI/litellmspring-projects/spring-ai