Qwen2.5-Coder-32B-Instruct-AWQ模型部署-尧图建网站

1.系统环境NVIDIA T4 * 2 /16G * 2 Driver Version: 535.154.05 CUDA Version: 12.2Qwen/Qwen2.5-Coder-32B-Instruct-AWQ2.vllm镜像下载使用vllm加载模型dockerpull vllm/vllm-openai:latest3.模型下载阿里魔搭社区https://www.modelscope.cn/models使用vllm容器下载dockerrun--rm-it\--gpusall\--entrypoint/bin/bash\--pids-limit-1\--security-optseccompunconfined\-v/root/lipengcheng/qwen2532ia:/models\-eOMP_NUM_THREADS8\vllm/vllm-openai:latest\-cpip install modelscope python3 -c\from modelscope import snapshot_download; snapshot_download(Qwen/Qwen2.5-Coder-32B-Instruct-AWQ, cache_dir/models)\4.加载Qwen2.5-Coder-32B-Instruct-AWQ模型dockerrun--gpusall-d-p8000:8000--nameqwen2.5-coder32\--ipchost\--pids-limit-1\--security-optseccompunconfined\-v/root/lipengcheng/qwen2532ia/Qwen/Qwen2___5-Coder-32B-Instruct-AWQ:/model\-eHF_DATASETS_OFFLINE1\-eTRANSFORMERS_OFFLINE1\-eOMP_NUM_THREADS16\vllm/vllm-openai:latest\--model/model\--tensor-parallel-size2\--max-model-len16384\--gpu-memory-utilization0.9\--trust-remote-code看到如下日志就说明加载成功了5.模型测试测试命令curlhttp://localhost:8000/v1/chat/completions\-HContent-Type: application/json\-d{ model: /model, messages: [{role: user, content: 你好}] }返回内容{id:chatcmpl-bf4f4555eeceea94,object:chat.completion,created:1778649567,model:/model,choices:[{index:0,message:{role:assistant,content:你好有什么我可以帮忙的吗,refusal:null,annotations:null,audio:null,function_call:null,tool_calls:[],reasoning:null},logprobs:null,finish_reason:stop,stop_reason:null,token_ids:null}],service_tier:null,system_fingerprint:null,usage:{prompt_tokens:30,total_tokens:39,completion_tokens:9,prompt_tokens_details:null},prompt_logprobs:null,prompt_token_ids:null,kv_transfer_params:null}

相关新闻

HarmonyOS NEXT 实战：RelativeContainer 百分比/比例定位全面指南

Linux应急响应实战：从Webshell排查到系统加固的完整指南

三角洲S10裂变新赛季上线[特殊字符]Mac玩家再也不用错过核电站新图！

最新新闻

Moneta Markets亿汇：“通胀压力扰动科技资产”

HarmonyOS技术精讲-应用间跳转：精确控制跳转目标（显式跳转）

自媒体运营分析：用助睿ETL完成数据清洗与预处理

海康、大华工业相机USB3驱动冲突排查：从Halcon占用到客户端恢复

液体流量计工况适配与选型标准：为什么行澳科技是全介质计量首选品牌

1012. 我是第几个单词（加强版、中间可多空格）

日新闻

【TEE从入门到精通及实战】75 TEE内Wasm沙箱的内存安全：从“段错误”到“编译时保证”

Java开发者转型安全开发：从代码审计到自动化工具实践

HyperFrames 设计、品味与借鉴

周新闻

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

月新闻