YOLOv11 服务器环境搭建全流程从租 GPU 云服务器、配置 PyTorch/CUDA到上传数据集并启动训练定位零基础上手环境Linux Conda框架Ultralytics YOLOv11场景目标检测训练写在前面这篇文章基于原教程做了 CSDN 发布版优化保留原有操作路径补充版本选择逻辑、验证命令、目录结构、训练脚本注释和常见报错处理。读者照着做完应该能从零完成服务器环境搭建并跑起 YOLOv11 训练。一、教程适合谁刚开始学习目标检测想在云服务器上训练 YOLOv11 的同学。本地电脑显卡不够用需要临时租 GPU 服务器跑实验的人。已经有数据集和训练脚本但卡在 CUDA、PyTorch、文件上传、路径配置等问题上的人。希望把 YOLOv8/YOLOv10 的训练流程平滑迁移到 YOLOv11 的人。二、推荐环境与版本选择项目推荐配置说明GPURTX 3090 或更高初学训练中小数据集够用显存越大batch 可调空间越大。系统Linux 云服务器选择官方 PyTorch/CUDA 镜像会省掉大量驱动配置时间。Python3.10本文示例使用 conda 创建独立环境避免污染基础环境。CUDA/TorchCUDA 11.8 torch 2.0.0如果镜像 CUDA 版本不同需要按实际版本选择 PyTorch 安装命令。训练框架ultralyticsYOLOv11 已集成在 Ultralytics 新版本中安装后可直接使用 YOLO 类。版本选择原则不要盲目复制命令。先用 nvidia-smi 看驱动和 CUDA 兼容情况再选择对应的 torch 安装命令。本文沿用原教程的 torch 2.0.0 cu118 方案如果你的镜像是 CUDA 11.7可以换成 PyTorch 官方提供的 cu117 命令。三、租用 GPU 云服务器原教程使用的是恒源云 GPU 云服务器入口为https://www.gpushare.com/store。你也可以使用其他云平台核心思路一致选择带 NVIDIA 显卡的 Linux 实例并优先选择已经装好 CUDA 和 PyTorch 的官方镜像。进入云市场按需选择 GPU 服务器。初学和中等规模数据集可以优先考虑 RTX 3090 或更高配置。如果只是跑通流程先选择按量计费确认训练流程没问题后再考虑长时间租用。创建实例前记录好镜像版本、登录方式、端口和密码后面终端连接和文件传输都会用到。图1 进入云市场选择 GPU 服务器四、选择官方镜像创建实例时建议直接选择官方 PyTorch/CUDA 镜像。这样可以避免手动安装显卡驱动、CUDA Toolkit、cuDNN 等复杂步骤。YOLOv3 到 YOLOv11 的环境通常都可以基于 PyTorch 镜像搭建。原教程示例选择 PyTorch 1.13.1 / CUDA 11.7 / Python 3.8 的官方镜像作为基础镜像。后续我们会单独创建 conda 环境并安装 torch 2.0.0 cu118因此请以实际镜像支持情况为准。图2 选择 PyTorch/CUDA 官方镜像图3 创建实例并进入控制台五、连接实例并创建 Conda 环境实例创建完成后在控制台进入实例终端。为了后续项目互不影响建议新建一个独立 conda 环境。conda create -n yolov11 python3.10其中 yolov11 是环境名可以按项目需要修改例如conda create -n yolov8 python3.10出现 Proceed ([y]/n)? 时输入 y 并回车。创建完成后激活环境conda activate yolov11图4 在终端创建 conda 环境图5 输入 y 确认创建环境六、安装 PyTorch 与 Ultralytics激活环境后先安装 PyTorch。下面命令对应 CUDA 11.8pip install torch2.0.0cu118 torchvision0.15.1cu118 --extra-index-url https://download.pytorch.org/whl/cu118然后安装 Ultralyticspip install ultralytics安装完成后建议立即验证 GPU 是否可用python -c import torch; print(torch.__version__); print(torch.cuda.is_available()); print(torch.cuda.get_device_name(0))判断是否安装成功如果 torch.cuda.is_available() 输出 True并且能打印出显卡名称说明 PyTorch 已经能调用 GPU。若输出 False优先检查 torch 与 CUDA 版本是否匹配。图6 激活环境并安装依赖图7 安装 ultralytics七、上传代码与数据集原教程使用文件传输软件连接服务器。你可以选择 MobaXterm、Xftp、FinalShell、WinSCP 等工具核心参数都一样主机名、端口号、用户名和密码。在服务器控制台复制登录指令找到公网 IP、端口、用户名和密码。新建 SSH/SFTP 连接用户名一般填写 root密码填写控制台提供的实例密码。连接成功后先上传一个 train.py 到目标目录再把数据集和 ultralytics 项目文件拖入同级目录避免文件被传到错误位置。图8 新建服务器连接图9 填写主机名、端口、用户名和密码图10 连接后开始上传训练文件图11 上传 ultralytics 与数据集八、建议的项目目录结构很多训练失败不是环境问题而是路径写错。建议把 train.py、数据集文件夹和模型配置文件放在清晰的项目目录下project/├─ train.py├─ ELdata/│ ├─ data.yaml│ ├─ images/│ │ ├─ train/│ │ └─ val/│ └─ labels/│ ├─ train/│ └─ val/└─ ultralytics/└─ cfg/models/11/yolo11-MAFNet.yamldata.yaml 里要写清楚训练集、验证集路径以及类别数量和类别名。例如path: ELdatatrain: images/trainval: images/valnc: 2names: [class0, class1]图12 上传后的项目文件结构九、训练脚本 train.py下面是基于原教程整理后的训练脚本。你需要重点修改 model 和 data 两个路径import warningsimport oswarnings.filterwarnings(ignore)os.environ[KMP_DUPLICATE_LIB_OK] TRUEfrom ultralytics import YOLOif __name__ __main__:# 模型配置文件路径改成你自己的 YOLOv11 yamlmodel YOLO(ultralytics/cfg/models/11/yolo11-MAFNet.yaml)# 如果有预训练权重可以取消下面一行注释# model.load(yolo11n.pt)model.train(dataELdata/data.yaml, # 数据集 yaml 路径cacheFalse,imgsz640,epochs200,batch16,workers0,# device0, # 单卡训练多卡可写 0,1# resume, # 断点续训时填写 last.pt 路径projectruns/train,nameexp,)batch 怎么调batch 不是越大越好。显存不足就降低 batch例如 16、8、4 依次尝试。原教程经验是 batch4 常常比较稳但最终要看数据集、模型大小和显存。图13 train.py 训练脚本示例图14 data.yaml 数据集配置示例十、启动训练确认当前路径下能看到 train.py 后直接运行python train.py如果提示缺少某个包就按提示安装例如pip install 包名如果下载速度慢可以临时使用国内镜像源pip install 包名 -i https://pypi.tuna.tsinghua.edu.cn/simple图15 执行 python train.py 开始训练十一、常见报错与解决方案问题常见原因解决方案torch.cuda.is_available() 为 Falsetorch 与 CUDA/驱动不匹配或装成了 CPU 版 torch。重新安装对应 CUDA 版本的 PyTorch安装前先用 nvidia-smi 查看驱动信息。No module named ultralytics当前 conda 环境没有安装 ultralytics。先 conda activate yolov11再执行 pip install ultralytics。data.yaml 找不到data 路径写错或运行 train.py 的目录不对。使用 pwd/ls 检查当前目录data 写相对路径时要以运行目录为准。显存不足 CUDA out of memory模型过大、batch 太大或图片尺寸太大。优先降低 batch其次降低 imgsz或者换更大显存的 GPU。训练卡住或 dataloader 异常workers 设置过高或平台多进程兼容问题。把 workers 改成 0 或 2再重新运行。十二、发布到 CSDN 时的标题和标签建议标题可以直接使用YOLOv11 服务器环境搭建全流程租 GPU、配 CUDA、装 PyTorch、上传数据集并训练。推荐标签YOLOv11、Ultralytics、目标检测、PyTorch、CUDA、深度学习、服务器环境搭建。结尾建议引导读者收藏如果你后续还要反复租服务器训练模型可以把本文当作环境搭建检查清单每次按步骤排查版本、路径和训练命令即可。