AI 数字人项目快速上手:RTX 4060 本地部署 Duix.Avatar 数字人:从 WSL2 环境搭建到视频生成的保姆级实战指南
视频展示AI 数字人展示视频前提准备系统Windows显卡NVIDIA RTX 4060使用方式本机 Docker 部署服务端 已下载好的 Duix.Avatar 客户端目标能直接创建数字人、输入文案并生成视频先去 Github 下载原代码之后解压我是保存在 E 盘https://github.com/duixcom/Duix-Avatar之后下载客户端https://github.com/duixcom/Duix-Avatar/releases/tag/v1.0.6一、整体流程Duix.Avatar 在 Windows 上需要同时准备两部分服务端用 Docker 启动 AI 推理服务负责声音克隆、语音识别、视频合成。客户端你已经下载好的桌面程序负责可视化操作。部署顺序安装 NVIDIA 驱动 ↓ 安装 / 检查 WSL2 ↓ 安装 Docker Desktop ↓ 启动 Docker 服务端 ↓ 启动 Duix.Avatar 客户端 ↓ 创建数字人模特 ↓ 生成数字人视频二、部署前检查2.1 确认显卡驱动打开 PowerShell执行nvidia-smi如果能看到类似下面的信息说明显卡驱动正常NVIDIA GeForce RTX 4060 Driver Version: xxx.xx CUDA Version: xx.x如果提示找不到命令或者看不到显卡信息需要先安装或更新 NVIDIA 驱动。NVIDIA 驱动下载https://www.nvidia.cn/drivers/lookup/2.2 确认磁盘空间默认配置会使用D:\duix_avatar_data保存数字人、音频、生成视频等数据。Docker 镜像目录一般在 C 盘或 Docker Desktop 配置的磁盘中。建议空间位置建议剩余空间D 盘大于 30GBDocker 镜像所在磁盘大于 100GB如果你的电脑没有 D 盘先不要直接启动。默认配置依赖 D 盘路径需要修改项目里的 Docker 挂载路径和客户端数据路径将其改为其他盘即可。2.3 确认内存建议内存 32GB。如果是 16GB可能出现容器启动慢、ASR 启动失败、合成任务失败等问题。三、安装 WSL23.1 检查 WSL打开 PowerShellwsl --list --verbose如果能看到已安装的 Linux 发行版并且VERSION是2说明 WSL2 已可用。示例NAME STATE VERSION * Ubuntu Running 2安装显示未安装显示3.2 如果没有 WSL执行wsl --install安装完成后重启电脑。然后更新 WSLwsl --update四、安装 Docker Desktop4.1 开始安装下载 Docker Desktop for Windowshttps://www.docker.com/products/docker-desktop/根据自己电脑系统进行选择安装时建议保持默认选项选择安装位置确保启用 WSL2 后端。接着点击下述因为下述操作会重启电脑记得保存好必要文件再点击。安装完成后启动 Docker Desktop首次启动时接受协议。可以跳过登录。等待左下角或主界面显示 Docker 正在运行。4.2 检查 DockerPowerShell 执行docker --version docker compose version如果docker compose version可用后面建议使用docker compose命令。如果你的环境只支持旧命令也可以使用docker-compose --version五、启动 Duix.Avatar 服务端5.1 进入项目部署目录假设你的项目目录是E:\Duix-Avatar打开 PowerShellcd E:\Duix-Avatar\deploy5.2 RTX 4060 应该用哪个部署文件你的显卡是 RTX 4060属于 40 系列显卡。下述不用执行大家了解一下。推荐使用默认完整版本deploy/docker-compose.yml如果你的是 5060 等使用 50 系列显卡需要使用下述专用的配置docker-compose-5090.yml5.3 启动完整服务在启动前需要更改一下映像保存位置如果你的 C 盘空间足远远大于 100 G就不用修改。如果你的 C 盘可用空间少于 100GB安装 Docker 后你可以选择下方位置剩余超过 100GB 的其他磁盘文件夹。执行docker compose up -d如果你的 Docker 不支持docker compose使用docker-compose up -d首次启动会下载三个镜像guiji2025/fish-speech-zimingguiji2025/fun-asrguiji2025/duix.avatar这个过程可能比较久半小时到数小时都有可能取决于网络情况如果下载很慢或者报错见 5.4 下载慢或失败怎么办。下载完成如图所示5.4 下载慢或失败怎么办如果报错中出现registry-1.docker.io Client.Timeout exceeded connection refused说明 Docker Hub 连接不稳定。处理方式检查网络。使用可用代理或全局网络。在 Docker Desktop 中配置镜像源。Docker Desktop 配置路径通常是Docker Desktop → Settings → Docker Engine可以参考如下格式添加镜像源{ builder: { gc: { defaultKeepStorage: 20GB, enabled: true } }, experimental: false, registry-mirrors: [ https://docker.m.daocloud.io, https://docker.1ms.run, https://atomhub.openatom.cn ] }保存后 Docker Desktop 会重启。重启完成后再次执行cd E:\Duix-Avatar\deploy docker compose up -d镜像源可能随时间失效如果还是失败需要换当前可用的 Docker 镜像源。下载完成如图所示六、检查服务是否启动成功执行docker ps正常情况下应看到三个容器duix-avatar-tts duix-avatar-asr duix-avatar-gen-video并且状态应该类似Up ...三个服务作用容器端口作用duix-avatar-tts18180声音克隆、文字转语音duix-avatar-asr10095语音识别duix-avatar-gen-video8383数字人视频合成6.1 查看端口执行netstat -ano | findstr 18180 netstat -ano | findstr 8383 netstat -ano | findstr 10095如果有监听信息说明端口已经暴露。6.2 查看日志如果某个容器没有启动查看日志docker logs duix-avatar-tts docker logs duix-avatar-asr docker logs duix-avatar-gen-video实时查看视频生成服务日志docker logs -f duix-avatar-gen-video七、启动客户端你已经下载了客户端接下来按系统安装包类型启动。7.1 Windows 安装包如果你下载的是Duix.Avatar-x.x.x-setup.exe直接双击安装。安装完成后从桌面图标或开始菜单启动Duix.Avatar7.2 启动前确认启动客户端前建议先确认docker ps三个容器都在运行后再打开客户端。如果刚刚启动 Docker 服务建议等待 2 到 5 分钟让 ASR / TTS 服务完全加载完成。RTX 4060 可以跑但首次加载模型可能会比较慢。八、第一次创建数字人8.1 准备视频素材用于创建模特的视频很关键。建议时长10 秒左右或更长一点。人物单人出镜。画面正脸清晰不要遮挡嘴巴。声音必须有人说话。环境背景安静噪音越少越好。动作不要大幅度转头不要频繁低头、侧脸。光线脸部清楚不要过暗或过曝。注意视频没有声音或者声音中不是人在说话创建模特很容易失败。8.2 在客户端创建模特操作流程打开 Duix.Avatar 客户端。进入首页或模特创建入口。点击创建 / 添加模特。输入模特名称。上传准备好的真人视频。等待客户端处理。处理过程中会自动完成视频格式转换。提取音频。调用 TTS 服务做声音预处理。保存模特信息。相关数据默认保存到D:\duix_avatar_data\voice\data\origin_audio D:\duix_avatar_data\face2face\temp创建成功后会在你的数字模特这里显示8.3 创建模特失败时先检查按顺序检查视频是否有声音。视频中是否有人说话。三个 Docker 容器是否都在 Running。是否刚启动服务就立刻创建建议等待几分钟。D 盘是否存在且可写。查看 TTS 和 ASR 日志docker logs duix-avatar-tts docker logs duix-avatar-asr九、第一次生成视频9.1 创建作品在客户端里选择已经创建好的数字人模特。进入视频编辑或作品创建页面。输入口播文案。选择声音。保存草稿。点击合成。9.2 等待生成客户端会自动把文案合成为音频。把音频和数字人视频提交到视频生成服务。查询生成进度。成功后显示作品。生成时间取决于视频长度。显卡性能。显存占用。当前是否有其他任务。RTX 4060 可以部署使用但建议第一次测试用短文案例如大家好欢迎使用 Duix.Avatar这是我的第一个数字人视频。先确认完整流程能跑通再尝试更长文案。十、常用命令10.1 启动服务cd E:\Duix-Avatar\deploy docker compose up -d10.2 停止服务cd E:\Duix-Avatar\deploy docker compose down10.3 重启服务cd E:\Duix-Avatar\deploy docker compose down docker compose up -d10.4 查看容器docker ps docker ps -a10.5 查看日志docker logs duix-avatar-tts docker logs duix-avatar-asr docker logs duix-avatar-gen-video10.6 更新服务端镜像cd E:\Duix-Avatar\deploy docker compose pull docker compose up -d十一、常见问题11.1 客户端连接不上服务表现创建模特失败。合成视频失败。报Connection refused。检查docker ps确认三个容器都在运行。再检查端口netstat -ano | findstr 18180 netstat -ano | findstr 8383如果端口没有监听说明服务没有正常启动。11.2 ASR 服务报错或连接失败如果创建模特时报 ASR 相关错误可能是duix-avatar-asr还没完全启动。处理启动 Docker 后等待几分钟。查看 ASR 日志docker logs duix-avatar-asr再重新创建模特。11.3 显存不足RTX 4060 常见有 8GB 显存版本。建议先用短视频、短文案测试。不要同时运行其他占用显存的软件。关闭大型游戏、AI 绘图、其他本地模型服务。合成任务失败时查看duix-avatar-gen-video日志。docker logs duix-avatar-gen-video11.4 Docker 容器一直 Restarting执行docker ps -a查看哪个容器在重启然后查看对应日志docker logs 容器名重点检查NVIDIA 驱动是否正常。Docker Desktop 是否能使用 WSL2。Docker 是否能访问 GPU。内存是否不足。镜像是否下载完整。11.5 没有 D 盘默认配置使用 D 盘D:\duix_avatar_data如果没有 D 盘需要修改deploy/docker-compose.yml客户端的数据目录配置如果你用的是官方已打包客户端客户端内部默认路径不方便改。最省事的做法是创建或挂载一个 D 盘或者使用有 D 盘的机器。十二、最简上手检查清单照这个顺序确认nvidia-smi能看到 RTX 4060。Docker Desktop 已启动。PowerShell 能执行docker --version。进入E:\Duix-Avatar\deploy。执行docker compose up -d。执行docker ps能看到三个容器。等待 2 到 5 分钟。打开已下载的 Duix.Avatar 客户端。上传一个有真人说话声音的视频创建模特。输入一句短文案测试合成。如果这 10 步都通过说明 Windows RTX 4060 本地部署已经跑通。