WorkBuddy 本地 ComfyUI 完全使用手册从出图到视频生成在本地 MCP 链路跑通后WorkBuddy 能做什么怎么做本文用真实测试案例告诉你——从文生图、文生视频到工作流调用、多阶段管道每个场景都有可直接复制的提示词和参数。本系列持续更新中……Comfy MCP 公测把 Claude、Cursor、CodeX、Hermes 和 WorkBuddy 变成你的创意技术专家Comfy Cloud MCP Server 抢先体验申请图文教程QClaw 配置 Comfy Cloud MCP只需简单几步WorkBuddy 接入 Comfy Cloud MCP 完整实录从 DNS 污染到 31 个工具全部启用WorkBuddy 本地 Comfy MCP 实战用自然语言调生成你的第一张 AI 图片WorkBuddy 连接本地 ComfyUI从零到出图的保姆级教程WorkBuddy 本地 ComfyUI Wan2.1 文生视频实战从连续报错到成功出片的完整踩坑记录目录一、能力总览二、使用前的准备三、场景一文生图SDXL四、场景二文生视频Wan2.1 t2v五、场景三调用已有工作流六、场景四多阶段管道七、场景五图生视频Wan2.2 Animate八、自然语言指令速查表九、参数调优指南十、常见问题与避坑十一、视频生成工作流 JSON 模板一、能力总览WorkBuddy 连接本地 ComfyUI 后你拥有以下能力能力说明典型耗时文生图文字描述 → 图片SDXL/SD3.5/Flux 等8-30 秒文生视频文字描述 → 视频Wan2.1 t2v2-5 分钟图生视频图片 提示词 → 视频Wan2.2 Animate5-15 分钟图片放大ESRGAN 超分辨率2x/4x5-15 秒背景移除BiRefNet 智能抠图10-30 秒工作流调用加载已保存的工作流并执行取决于工作流工作流分析可视化工作流结构即时模型管理列出/搜索本地模型即时硬件基础RTX 3090 24GB 320 个自定义节点 57 个 checkpoint 177 个 LoRA 45 个 ControlNet二、使用前的准备2.1 确保两个进程都在运行bash# 终端 1启动 ComfyUI保持窗口开着 cd H:\PythonProjects3\Win_ComfyUI python main.py --enable-manager --enable-assets --enable-triton-backend --async-offload --use-flash-attention --enable-dynamic-vram # 终端 2启动 MCP 服务器保持窗口开着 npx -y comfyui-mcp --http --port 91002.2 在 WorkBuddy 中确认连接器状态打开 WorkBuddy → 右上角连接器管理comfyui-local开关应为绿色已信任显示 113 个工具已启用2.3 验证连接直接对 WorkBuddy 说检查一下本地 ComfyUI 的系统状态WorkBuddy 会调用get_system_stats工具返回 GPU 型号、显存、队列状态等信息。三、场景一文生图SDXL3.1 基本用法直接用自然语言告诉 WorkBuddy用本地 ComfyUI 生成一张赛博朋克城市的图片霓虹灯雨天1024x10243.2 推荐参数组合风格模型采样器步数CFG调度器快速测试sdxl_lightning_4stepeuler41.0normal标准生成sd_xl_base_1.0dpmpp_2m207.5karras高质量sd_xl_base_1.0dpmpp_2m_sde307.0karras动漫风格你的动漫 SDXL 模型euler_ancestral257.0normal3.3 实测案例提示词masterpiece, best quality, a red vintage sports car parked on a coastal highway at sunset, ocean waves in background, golden hour lighting, cinematic, highly detailed, 8k uhd参数sd_xl_base_1.0 / dpmpp_2m / karras / 20 步 / CFG 7.5 / 1024x1024结果8 秒出图质量清晰3.4 ⚠️ Lightning 模型避坑SDXL Lightning 4-step 模型必须使用以下参数否则出白图采样器euler不是 dpmpp_2m_sde 调度器normal不是 karras CFG1.0不是 7.5 步数4四、场景二文生视频Wan2.1 t2v4.1 基本信息项目值模型wan2.1_t2v_1.3B_fp16.safetensors文本编码器UMT5-XXL bf16VAEWan2_1_VAE_bf16.safetensors默认分辨率832×480默认帧数81 帧 20fps ≈ 4 秒采样步数20 步RTX 3090 生成时间约 3 分钟4.2 使用方法直接告诉 WorkBuddy用 Wan 生成一段猫咪追球的 4 秒视频或者更具体用本地 ComfyUI 的 Wan2.1 t2v 模型生成一段 4 秒视频一只橘猫在花园里追红色小球阳光明媚动态运动832x480 分辨率4.3 实测案例提示词a cute orange cat chasing a red ball across a green garden lawn, running playfully, dynamic motion, sunny day, vivid colors, 4k, high quality负面提示词low quality, blurry, deformed, ugly, watermark, text, static, no motion, worst quality, jpeg artifacts参数分辨率832×480帧数81 20fps ~4 秒采样器euler步数20CFG3.5Shift5.0Seed42结果174 秒生成输出 MP4 文件 1.3MB4.4 视频参数调整需求修改更长视频num_frames改为 1216 秒/ 1618 秒帧数必须是 4 的倍数1更高分辨率width/height改为 1280×720显存需求大增更快生成steps改为 15质量略降更高质量steps改为 30时间翻倍不同风格修改positive_prompt固定种子保持seed不变可复现结果4.5 工作流节点结构LoadWanVideoT5TextEncoder ──→ WanVideoTextEncode ──→ WanVideoSampler ──→ WanVideoDecode ──→ VHS_VideoCombine ↑ ↑ WanVideoModelLoader ─────────────────────────────────┘ │ WanVideoEmptyEmbeds ─────────────────────────────────→ ┘ │ WanVideoVAELoader ──────────────────────────────────────────────────────→┘节点说明节点作用关键参数LoadWanVideoT5TextEncoder加载 UMT5-XXL 文本编码器model_name, precision, load_deviceWanVideoModelLoader加载视频扩散模型model, base_precision, quantizationWanVideoTextEncode编码文本提示词positive_prompt, negative_promptWanVideoEmptyEmbeds创建空图像嵌入文生视频用width, height, num_framesWanVideoVAELoader加载 VAE 解码器model_name, precisionWanVideoSampler核心采样器steps, cfg, shift, seed, schedulerWanVideoDecode将潜空间解码为视频帧enable_vae_tiling, tile_x/yVHS_VideoCombine合成视频文件frame_rate, format五、场景三调用已有工作流5.1 查看已有工作流你本地保存了 68 个工作流。告诉 WorkBuddy列出我本地 ComfyUI 的所有视频相关工作流5.2 可用工作流示例工作流文件功能video_wan2_2_14B_animate.jsonWan2.2 动作迁移视频Wan-Animate【动作迁移】换人-高质量高细节.json高质量换人动画Kandinsky 5.0 Video Lite 图生视频video_kandinsky5_i2v.jsonKandinsky 图生视频image_qwen_image_edit_2509.json千问图片编辑flux_kontext_dev_basic.jsonFlux 上下文编辑whisper_video_subtitles_workflow.json视频自动字幕扩图flux_fill_outpaint.json图片扩边5.3 调用方式运行我的 Wan2.2 Animate 工作流用这张图片作为输入WorkBuddy 会list_workflows— 找到工作流analyze_workflow— 分析参数需求提示你提供必要输入如参考图片、提示词enqueue_workflow— 提交执行轮询等待完成六、场景四多阶段管道6.1 概念把多个生成阶段串起来前一步的输出作为后一步的输入。6.2 示例管道生成一只猫的图 → 放大 4 倍 → 抠去背景WorkBuddy 会编排阶段 1: generate_image(a cute cat) → output/cat.png ↓ 阶段 2: upscale_image(cat.png, scale4) → output/cat_4x.png ↓ 阶段 3: remove_background(cat_4x.png) → output/cat_cutout.png6.3 更复杂的管道生成一只猫 → 用 Wan2.2 Animate 做成视频 → 加上字幕阶段 1: generate_image → cat.png 阶段 2: animate_image(cat.png) → cat.mp4 阶段 3: add_subtitles(cat.mp4, A cat playing) → cat_subtitled.mp4七、场景五图生视频Wan2.2 Animate7.1 前提条件你有以下 Wan2.2 模型Wan2_2-Animate-14B_fp8_e4m3fn_scaled_KJ.safetensors— 动作迁移Wan2.2-Animate-14B-Q4_K_S.gguf— GGUF 量化版Wan2.2-Fun-A14B-Control_HighNoise/LowNoise-Q5_K_S.gguf— 控制生成7.2 使用方式Wan2.2 Animate 需要参考视频来提取动作然后将动作迁移到新生成的角色上。用 Wan2.2 Animate 把这个跳舞视频的动作迁移到一只猫身上7.3 注意事项Wan2.2 Animate 是 14B 模型RTX 3090 24GB 需要使用 block swap建议使用 GGUF 量化版Q4_K_S以减少显存占用参考视频建议 5-10 秒分辨率不超过 720p生成时间约 10-30 分钟取决于帧数和分辨率八、自然语言指令速查表8.1 图片生成说法WorkBuddy 会做什么生成一张[描述]的图片选择合适模型构建 txt2img 工作流用 SDXL 生成[描述]1024x1024指定模型和分辨率用 Flux 生成[描述]切换到 Flux 模型换一个种子重新生成修改 seed 值重新提交把这张图放大 4 倍使用 ESRGAN 放大去掉这张图的背景使用 BiRefNet 抠图8.2 视频生成说法WorkBuddy 会做什么用 Wan 生成一段[描述]的 4 秒视频构建 Wan2.1 t2v 工作流生成一段更长的视频8 秒增加 num_frames 到 161提高视频分辨率到 720p修改 width/height用我的 Wan2.2 Animate 工作流加载已有工作流执行8.3 工作流操作说法WorkBuddy 会做什么列出我的所有工作流调用 list_workflows分析我的换头工作流调用 analyze_workflow 可视化检查这个工作流用的模型分析节点参数修改这个工作流的采样步数为 30调用 modify_workflow8.4 系统管理说法WorkBuddy 会做什么检查 ComfyUI 状态调用 get_system_stats查看当前队列调用 get_queue列出本地所有模型调用 list_local_models取消正在运行的任务调用 cancel_job九、参数调优指南9.1 图片生成参数参数作用推荐值steps采样步数越多越精细但越慢20-30标准/ 4Lightningcfg提示词权重越高越忠实提示词7-8标准/ 1.0Lightningsampler_name采样算法dpmpp_2m通用/ eulerLightningscheduler噪声调度karras通用/ normalLightningseed随机种子任意整数固定可复现denoise去噪强度1.0完整生成/ 0.3-0.7图生图9.2 视频生成参数参数作用推荐值num_frames视频帧数4n1814秒/ 1216秒/ 1618秒frame_rate帧率16-24width/height分辨率832×480快速/ 1280×720高清steps采样步数15-25cfg提示词权重3.0-5.0shift噪声偏移3.0-7.0scheduler采样器euler / unipc9.3 显存优化RTX 3090 24GB 的显存管理策略策略设置适用场景T5 编码器卸载load_device: offload_device所有视频生成VAE 分块解码enable_vae_tiling: True高分辨率视频Block Swapblocks_to_swap: 20-3514B 大模型模型精度bf16或fp8_e4m3fn大模型省显存force_offloadTrue采样后释放显存十、常见问题与避坑10.1 视频生成相关Q: T5 编码器报错 fp8 scaled is not supportedA:LoadWanVideoT5TextEncoder不支持 fp8 scaled 模型。使用 bf16 版本的 UMT5-XXL。Q: VAE 加载报错 missing precision argumentA:WanVideoVAELoader必须显式提供precision参数如bf16即使文档标记为 Optional。Q: 生成时间太长A: 1.3B 模型 81 帧 20 步约 3 分钟。如需更快减少步数到 15、降低分辨率到 832×480、减少帧数到 65。Q: 视频质量模糊A: 增加 steps 到 25-30提高 CFG 到 4.0-5.0使用更好的提示词描述。10.2 图片生成相关Q: Lightning 模型出白图A: 必须用euler normal CFG 1.0 4 steps。不能用 dpmpp_2m_sde 或 karras。Q: 中文提示词效果差A: ComfyUI 的 CLIP/T5 编码器主要训练于英文数据。建议用英文提示词。10.3 连接相关Q: WorkBuddy 调用 MCP 工具失败A: 重启 MCP 服务器后WorkBuddy 需要重新连接。去连接器页面关掉再开comfyui-local。Q: EADDRINUSE 端口占用A:netstat -ano | findstr :9100找到 PIDtaskkill /PID PID /F结束再重启。十一、视频生成工作流 JSON 模板以下是实测成功的完整 Wan2.1 t2v 文生视频工作流 JSON可直接通过 ComfyUI API 提交json{ 1: { class_type: LoadWanVideoT5TextEncoder, inputs: { model_name: models_eddy大佬_t5_umt5-xxl-enc-bf16_fully_uncensored.safetensors, precision: bf16, load_device: offload_device } }, 2: { class_type: WanVideoModelLoader, inputs: { model: wan2.1_t2v_1.3B_fp16.safetensors, base_precision: bf16, quantization: disabled, load_device: main_device } }, 3: { class_type: WanVideoTextEncode, inputs: { positive_prompt: YOUR_POSITIVE_PROMPT_HERE, negative_prompt: low quality, blurry, deformed, ugly, watermark, text, static, no motion, worst quality, t5: [1, 0], force_offload: true, model_to_offload: [2, 0] } }, 4: { class_type: WanVideoEmptyEmbeds, inputs: { width: 832, height: 480, num_frames: 81 } }, 5: { class_type: WanVideoVAELoader, inputs: { model_name: Wan2_1_VAE_bf16.safetensors, precision: bf16 } }, 6: { class_type: WanVideoSampler, inputs: { model: [2, 0], image_embeds: [4, 0], text_embeds: [3, 0], steps: 20, cfg: 3.5, shift: 5.0, seed: 42, force_offload: true, scheduler: euler, riflex_freq_index: 0 } }, 7: { class_type: WanVideoDecode, inputs: { vae: [5, 0], samples: [6, 0], enable_vae_tiling: true, tile_x: 256, tile_y: 256, tile_stride_x: 128, tile_stride_y: 128 } }, 8: { class_type: VHS_VideoCombine, inputs: { images: [7, 0], frame_rate: 20, loop_count: 0, filename_prefix: wan_video_output, format: video/h264-mp4, pingpong: false, save_output: true } } }使用方法将YOUR_POSITIVE_PROMPT_HERE替换为你的提示词通过 ComfyUI API 提交POSThttp://127.0.0.1:8188/promptbody 为{prompt: 上述JSON}轮询GEThttp://127.0.0.1:8188/history/{prompt_id} 等待完成完成后视频保存在output/目录附录测试记录汇总测试类型模型参数耗时结果#1文生图sdxl_lightning_4stepdpmpp_2m_sde/karras/CFG1.5/4步8s白图参数错误#2文生图sdxl_lightning_4stepeuler/normal/CFG1.0/4步6s成功偏离提示词#3文生图sd_xl_base_1.0dpmpp_2m/karras/CFG7.5/20步8s成功#4文生视频wan2.1_t2v_1.3Beuler/20步/CFG3.5/81帧174s成功写在最后本地 ComfyUI WorkBuddy 的组合让你在 Claude 封禁中国账号、Comfy Cloud MCP 不可用的情况下依然拥有完整的 AI 图像/视频生成能力。零订阅费、完全离线、全隐私——你的 RTX 3090 就是最好的云端 GPU。