开源图像后处理实测:抠图/超分/修脸本地部署全攻略(含 7 个踩坑,2026)
关键词开源抠图、BiRefNet、RMBG、Real-ESRGAN、CodeFormer、图像超分、人脸修复、本地部署、basicsr 安装报错本文真机实测 RTX 4090但 6G 卡足够上的 5 个开源图像后处理模型给出耗时/显存/PSNR 硬数据并完整记录 basicsr/opencv/transformers 的依赖地狱怎么填平。0. 模型清单与定位子方向模型网络许可抠图RMBG-1.4ISNet非商用抠图BiRefNet双边参考网络MIT超分Real-ESRGAN x4plusRRDBNetBSD-3超分realesr-general-x4v3SRVGGNetCompactBSD-3修脸CodeFormerTransformer codebook研究免费1. 环境关键版本要锁死这套老牌 CV 工具对版本极其敏感照抄conda create-nimgprocpython3.10-yconda activate imgproc pipinstalltorch2.1.2torchvision0.16.2 --index-url https://download.pytorch.org/whl/cu121 pipinstallsetuptools81numpy2# 关键见坑1、坑2pipinstalltransformers4.46.3# 关键见坑3pipinstallopencv-python4.9.0.80# 关键见坑2pipinstallbasicsr --no-deps --no-build-isolation# 关键见坑1pipinstallrealesrgan gfpgan facexlib --no-deps --no-build-isolation pipinstalladdict yapf lmdb future pyyaml tqdm filterpy numba lpips scikit-image2. 实测数据抠图1024 输入RMBG-1.4 0.09s/张、1.09GBiRefNet 0.17s/张、3.35G发丝边缘更干净。超分4×对 4× 降质 JPEG q30 的输入与 GT 比对模型PSNRSSIM耗时显存Real-ESRGAN x4plus29.700.8860.10s0.66Ggeneral-x4v329.190.8950.04s0.05G有意思x4plus PSNR 更高但 SSIM 更低更锐但偶有 GAN 伪纹general-v3 更平滑、快一倍、显存几乎为 0。修脸CodeFormerw0.7 3.9s/张、PSNR 27.17、SSIM 0.869、1.81G。注修脸 PSNR 偏低是因为它重新生成五官像素改写主观清晰度才是重点。3. 七个踩坑本文核心价值坑 1basicsr 安装两连击setuptools81删了pkg_resources→ basicsr 编译报ModuleNotFoundError: pkg_resources。降setuptools81。basicsr 声明tb-nightly等装不上的依赖 → 用--no-deps --no-build-isolation再手动补addict yapf lmdb future。坑 2numpy 2.x ABI 把 opencv 打废装numpy2basicsr 需要后为 numpy2 编译的opencv-python 4.10出现module cv2 has no attribute cvtColorC 扩展半加载。换opencv-python4.9.0.80。坑 3transformers 5.x 检测不到 torchtransformers5.12torch 2.1.2→AutoModelForImageSegmentation requires the PyTorch library but it was not found。降transformers4.46.3。坑 4RMBG-2.0 是 gated 仓库HuggingFace 上briaai/RMBG-2.0需登录审批 非商用 → 匿名报Access denied。用开放的 BiRefNetMIT或 RMBG-1.4 替代。坑 5RMBG-1.4 与 BiRefNet 输出格式不同BiRefNetmodel(x)[-1].sigmoid()RMBG-1.4ISNetmodel(x)[0][0]然后min-max 归一不是 sigmoid坑 6修脸模型的隐藏网络阻塞facexlib 的 RetinaFace 用pretrainedTrue的 ResNet50 backbone → torchvision 直连download.pytorch.org下 ImageNet 权重。如果你像下 HF 模型那样unset了代理这里会卡死。修脸模型不碰 HF反而要开代理os.environ[http_proxy]os.environ[https_proxy]http://127.0.0.1:10808并预缓存resnet50-0676ba61.pth、detection_Resnet50_Final.pth、parsing_parsenet.pth。坑 7GFPGAN 段错误 → 换 CodeFormerGFPGAN 在numpy1.26 opencv4.9 torch2.1下 exit 1 无 traceback疑似 ABI 段错误。改用 CodeFormer补lpips并在仓库basicsr/下手建version.py仓库 vendored basicsr 的版本文件未生成。4. 核心代码抠图fromtransformersimportAutoModelForImageSegmentationfromtorchvisionimporttransforms modelAutoModelForImageSegmentation.from_pretrained(BiRefNet,trust_remote_codeTrue).cuda().eval()tftransforms.Compose([transforms.Resize((1024,1024)),transforms.ToTensor(),transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])])xtf(img).unsqueeze(0).cuda()maskmodel(x)[-1].sigmoid().cpu()[0].squeeze()# RMBG-1.4 改 model(x)[0][0] minmax完整脚本含超分 PSNR/SSIM、CodeFormer 封装、显存采样见仓库scripts/。5. 选型结论抠图商用 →BiRefNetMIT极轻量 → RMBG-1.4超分性价比 →general-x4v30.05G 显存、快一倍极致锐利 → x4plus修脸 →CodeFormer身份保真 强度可调这套工具6G 显卡就够秒级、可常驻是最易落地的 AI 能力。实测RTX 4090 24G / 2026-06。数据可复现。