《AI 知识卡片》第 02 期 · 一个参数决定 AI 是严谨还是放飞同一个问题你问 AI 两遍有时两次答得几乎一样有时却差挺多这个“时而稳定、时而多变”其实是可以调的。控制它的旋钮就叫temperature温度。一句话温度越低AI 越稳定、越确定温度越高AI 越爱变花样、越放飞。从 LLM 的工作原理讲起要理解temperature得先知道 LLM每一步在做什么。当 LLM 生成下一个字token时它并不是直接写出一个答案而是先算出“词汇表里每个 token 出现的概率”。比如给定前文“今天天气真”模型内部会算好32%、热18%、冷12%、不错10%、糟糕5%、…后面可能还有几万个候选概率都很小。然后它照着这张概率表来挑词。而temperature管的就是它挑得有多守规矩。低温和高温的差别你可以把温度理解成在调整这张表里“高分词和低分词的差距”温度调低差距被拉大——本来领先的“好”会变得更强几乎独占概率。于是 AI 每次都挑它输出稳定、确定、可复现但也保守、没惊喜。温度调高差距被抹平——像“冷”“糟糕”这些低分词也有了出头的机会。于是输出多样、有创意但也更容易跑偏。Temperature 就是用来“掰弯”这张概率表的旋钮。温度低强者通吃温度高雨露均沾。那到底该怎么设记住一句口诀就行要“准”往低拧要“创意”往高拧。实战速查表场景temperature说明Agent 决策 / 工具调用0 ~ 0.2选错一步全盘乱要最稳分类 / 判断0要可复现同样输入同样结果信息提取 / 翻译0 ~ 0.3要忠实原文不能自己加戏代码 / SQL 生成0 ~ 0.3语法要严谨不能瞎写日常问答 / 内容总结0.3 ~ 0.7既准确又读得顺文案 / 起名 / 写作0.8 ~ 1.2要多样、要有花样头脑风暴0.9 ~ 1.3就指望它给点意外灵感在代码里它就是一个参数# 写作/起名等要多样 → 温度调高client.chat.completions.create(modelgpt-4o,messages[...],temperature1.0)# 调用工具/决策要准、要可复现 → 温度压到 0client.chat.completions.create(modelgpt-4o,messages[...],temperature0)两个理解误区误区一以为“温度越高 AI 越聪明”。高温只是让它更敢用冷门词跟懂不懂、对不对没关系。该答错的高温下照样错只是错得更花哨。误区二以为“调低温度能治胡说八道”。压低温度能让它少乱来但如果模型本来就记错了某个事实低温只会让它更稳定地答错稳定不等同于准确。治“幻觉”得靠别的办法比如把资料喂给它、允许它说“不知道”这个以后单独聊。顺便认识几个“兄弟参数”调 AI 时温度常和下面几个参数一起出现大致了解一下参数职责说明temperature敢不敢变本文主角控制随机性高低top_p核采样在多大范围里挑只在概率最高的一小撮词里选如0.9 凑够 90% 概率就够长尾词不看。值越小越保守top_k在多大范围里挑更直接只在概率最高的 k 个词里选如50 只看前 50 个候选max_tokens什么时候停输出长度上限防止啰嗦没完也能控成本stop什么时候停碰到指定的词就立刻收笔如遇到\n\n就停最重要的一条top_p和temperature一次只调一个同时拧两个会互相干扰结果反而难捉摸。归类理解temperature管“敢不敢变”top_p/top_k管“在多大范围里挑”max_tokens/stop管“什么时候停”。一句话总结temperature不改变 AI 懂多少只改变它敢不敢“乱来”。要稳压低它要野调高它。