斯坦福CS146S课程 提示词工程全解(第1周):6大核心技术从原理到代码实战
斯坦福CS146S课程 提示词工程全解第1周6大核心技术从原理到代码实战本文对应斯坦福 CS146S 课程第1周内容完整覆盖课件核心理论 6个作业代码逐行解析 新手踩坑排错指南零基础也能吃透提示词工程的核心逻辑。课程以及作业地址https://github.com/ShouZhengAI/CS146S_CN一、本章导学1.1 学习目标与能力收获学完本章你将掌握✅ 6种核心提示词技术的原理、适用场景和效果差异✅ 从零设计提示词的方法论能通过迭代优化解决实际问题✅ 读懂「模型调用 自动测试」类 Python 脚本的完整逻辑✅ 本地大模型开发的常见坑点与排错思路✅ 能够根据业务场景选择合适的提示词技术组合方案。二、核心知识点精讲2.1 前置认知从 Software 1.0 到 3.0这是课程的核心认知框架理解了它就能明白「提示词工程为什么存在」。版本核心逻辑编程方式类比Software 1.0人类手写每一行规则程序严格按代码执行传统编程if/else、循环你亲手给机器写操作手册一步都不能错Software 2.0用数据训练模型让模型自己学习规律机器学习、深度学习你给机器看一万张猫的照片让它自己学会认猫Software 3.0用自然语言给大模型下指令让大模型完成任务提示词工程Prompt Engineering你给一个能干的助理提要求它自己想办法把事做完提示词就是 Software 3.0 的「编程语言」提示词工程就是教你怎么把需求说清楚、让大模型做对事的学问。2.2 基础概念提示词的三类角色大模型的对话接口通常有三种角色的消息各司其职System Prompt系统提示词用户看不到是给模型定的「底层规矩」用来设定人设、输出规则、边界约束、任务目标优先级最高全程生效。User Prompt用户提示词用户实际提出的问题/指令是单次任务的具体需求。Assistant助手回复模型生成的输出内容多轮对话中会作为上下文继续传给模型。2.3 六大核心提示词技术本周学习的6种技术是提示词工程的基石几乎所有复杂的大模型应用都由它们组合而来。1. Zero-shot / K-shot 提示词定义Zero-shot零样本不给任何示例直接让模型做事。比如直接说「把这个单词反转」。K-shot少样本给模型 K 个「输入-输出」的示例让它照着示例的格式和逻辑做新任务。核心原理大模型有「上下文学习In-context Learning」的能力——不需要改参数只要在对话里给示例它就能当场学会任务模式。适用场景格式固定、逻辑简单的任务比如文本反转、分类、格式转换。小白类比Zero-shot 是老板只说「去做个报表」K-shot 是老板先给你3张做好的报表当模板再让你做新的。关键经验示例的质量和目标的相似度远比数量重要。结构高度匹配的1个示例好过10个不相关的示例。2. 思维链 Chain-of-Thought (CoT)定义引导大模型不要直接给答案而是一步步说出推理过程最后再给出结论。Zero-shot CoT只加一句「Think step by step一步步思考」Multi-shot CoT给几个带完整推理过程的示例。核心原理大模型是「逐词生成」的直接出答案很容易跳步算错强迫它把中间步骤写出来能显著提升复杂推理的准确率。适用场景数学题、逻辑推理、代码调试、复杂问题分析。小白类比做数学题直接写答案很容易算错老师让你把步骤写出来正确率就高很多。3. 自一致性 Self-consistency定义同一个问题让模型生成多次答案最后取「出现次数最多的那个」作为最终结果。核心原理模型每次推理的路径可能不同错误的路径千奇百怪正确的路径往往殊途同归——多数票胜出的答案正确率更高。本质是「模型版投票表决」。适用场景有唯一正确答案的推理题搭配思维链使用效果最佳。小白类比一道难题你自己算5遍取出现最多的答案比只算一次更靠谱。4. 工具调用 Tool Calling定义让大模型学会「调用外部工具」比如查数据库、执行代码、调API而不是全靠自己脑子里的知识回答。核心原理大模型不用真的会执行工具只要能按固定格式输出「要调用哪个工具、传什么参数」程序拿到后去执行再把结果塞回对话里就行。适用场景需要实时数据、精确计算、操作外部系统的场景是减少幻觉的核心手段。小白类比你让助理算账助理不用自己心算而是拿计算器算完告诉你结果。5. 检索增强生成 RAG定义回答问题前先从外部知识库文档、数据库里检索相关内容再让模型只根据检索到的内容生成答案。核心原理解决大模型的「幻觉」和「知识过时」问题——模型不用记所有知识需要的时候去「查资料」只按资料回答。适用场景企业内部知识库问答、产品文档客服、基于专属文档的生成任务。小白类比闭卷考试模型容易瞎蒙开卷考试给它指定教材它就只能按教材答题。6. 反思 Reflexion定义先生成一版答案然后把「答案的错误/反馈」告诉模型让它自我反思、修正生成优化后的版本。核心原理单轮生成模型容易有疏漏但把错误信息明确反馈给它它通常能精准修正——形成「生成→评估→反馈→优化」的闭环。适用场景代码生成、文案润色、方案优化等可以迭代改进的任务。小白类比写第一版草稿 → 老师批改指出错误 → 你改出第二版通常比一稿质量高。2.4 提示词工程最佳实践角色设定Role Prompting给模型一个明确的身份比如「你是资深Python开发工程师」输出质量会显著提升结构化格式用标签、分段、列表把输入内容分清楚比如文档.../文档模型更容易理解边界明确输出要求说清格式、长度、约束比如「只输出代码不要任何解释文字」「最后一行写 Answer: 数字」清晰易懂原则你把提示词给一个完全没背景的人看如果他会困惑那大模型也会困惑小步迭代每次只改一个变量观察效果变化不要一次性大改否则不知道是哪步起了作用。四、课后思考题5.1 题目如果你要为公司开发一个「内部技术文档问答机器人」要求答案必须严格来自内部文档不能编造不存在的API和参数回答代码问题时要给出可运行的代码且能自我检查修正遇到需要计算、查日志的问题能调用外部工具获取准确结果。请问你会组合使用本周学的哪几种提示词技术每种技术分别承担什么作用5.2 参考答案推荐组合方案RAG 工具调用 Reflexion 思维链分工如下RAG核心底座。用户提问后先从内部技术文档库里检索最相关的几段内容作为唯一参考上下文从根源避免编造信息。工具调用扩展能力。遇到查日志、执行代码、算数据的问题让模型调用对应工具不用靠记忆回答保证结果精准。思维链提升推理准确率。回答复杂逻辑、代码问题时引导模型分步分析减少跳步错误。Reflexion质量兜底。生成答案后先做自检比如检查代码是否有语法错误、是否符合文档发现问题自动修正一轮再输出。六、本章总结本周我们完整学习了提示词工程的6大基础技术K-shot靠示例让模型快速学会任务模式CoT靠分步思考提升复杂推理准确率自一致性靠多轮投票降低随机错误工具调用靠外部工具突破模型能力边界RAG靠外部知识库减少幻觉、更新知识Reflexion靠反馈闭环自我迭代优化。这6种技术不是孤立的真实业务里几乎都是组合使用它们共同构成了大模型应用开发的「提示词工具箱」。七、下一章预告下一章我们将进入「提示词进阶与评估」讲解如何量化评估提示词的效果而不是靠感觉提示词的对抗与安全如何避免提示注入攻击更复杂的多轮对话与代理Agent基础逻辑。