第5章:HTTP API入门——用curl调用本地模型
1. 项目背景业务场景某中型SaaS公司决定将AI能力集成到现有的工单系统中。工单系统是一个Python后端服务,需要实现"智能工单分类"功能:客服创建工单时输入自然语言描述,系统自动推荐工单分类(如"技术故障/账户问题/退款申请/功能咨询")。技术选型会上定了方案:用本地Ollama部署的大模型做分类推理。但是——实现这个功能的开发小周只熟悉Python,对Ollama的理解停留在上一章学的命令行ollama run。他试图在Python代码里用subprocess.call(["ollama", "run", ...])来实现,代码像下面这样:# 错误示范:用subprocess调用CLIimportsubprocess result=subprocess.run(["ollama",