目录开篇先把问题说简单一、核心概念二、从概念到项目读文章时别漏掉这些问题三、一个贴近真实场景的例子四、常见误区五、怎么继续学或落地小结开篇先把问题说简单现在很多人说自己会 AI其实只是会打开聊天窗口问几个问题。这当然有价值但还不够。真正能把 AI 用好的人通常不是因为记住了某个神奇提示词而是知道每个功能背后大概发生了什么。比如为什么同一个问题换个问法结果不同为什么长文档会超出上下文为什么模型会编造事实为什么企业知识库问答不能只靠一个大模型这些问题都指向 AI 的基础概念。下面这篇文章会用尽量直白的方式整理 20 个常见概念。你不需要一次背下来先建立印象以后看到产品文档、技术方案或招聘要求时就不容易被术语牵着走。一、核心概念1. AI、机器学习、深度学习AI 是大目标机器学习是实现 AI 的重要方法深度学习是机器学习中使用多层神经网络的一支。三者不是并列关系而是层层包含。你可以把 AI 看成“让机器完成智能任务”的领域把机器学习看成“从数据中学习规律”的方法把深度学习看成“用复杂神经网络学习高维数据”的工具箱。很多营销材料会把这些词混着用。判断时不用纠结名称重点看系统是否真的使用数据学习、是否能泛化到新样本、是否有可验证效果。2. 模型、参数、训练模型是一套可计算的规则参数是规则中的可调整数值训练就是根据数据不断调整参数。大模型之所以叫大通常是因为参数规模、训练数据和计算量都很大。当你向聊天模型提问时它并不是现场学习全部知识而是利用训练阶段形成的参数再结合当前输入生成回答。参数多不等于必然更好。小模型在固定任务上可能更快、更便宜、更可控大模型则适合开放式理解和生成。3. Token、上下文、窗口长度Token 可以粗略理解为模型处理文本的基本单位可能是一个字、一个词或词的一部分。上下文窗口就是模型一次能看到的 Token 数量上限。如果你把一本书全部塞给模型超过窗口的部分就无法同时参与推理。很多长文档问答、合同分析、代码库理解都要面对上下文限制。所以真正的 AI 应用不会无限制地把材料全扔给模型而会做切分、检索、摘要、缓存和分层处理。4. Prompt 与系统提示词Prompt 是你给模型的输入指令。好的 Prompt 会说明角色、任务、背景、格式、约束和示例。系统提示词通常用于设定模型在应用中的整体行为边界。比如让模型“写一篇文章”和“面向 Java 后端新手写一篇 3000 字技术博客包含目录、示例、误区和总结”效果肯定不同。但 Prompt 不是万能药。数据缺失、知识过期、权限不足、模型能力不够时单靠提示词很难彻底解决。5. 幻觉、事实校验、引用来源大模型会生成看起来合理但实际错误的内容这就是常说的幻觉。它的目标是根据上下文生成高概率文本并不天然保证每一句都来自可靠来源。在写作、头脑风暴、代码解释中幻觉风险可以通过人工检查降低在法律、医疗、金融、企业制度等场景必须接入权威资料和校验流程。遇到需要事实准确的任务要让模型给出处、引用原文、说明不确定性并保留人工复核入口。6. Embedding、向量数据库、语义搜索Embedding 是把文本、图片等内容转换成向量的技术。向量能表达语义相似度所以“如何请年假”和“休假流程是什么”即使字面不同也可能被判断为相近问题。向量数据库负责存储和检索这些向量是知识库问答、推荐系统、相似图片搜索的重要基础。但语义相似不等于一定正确。检索结果还需要排序、过滤、权限控制和引用展示。7. RAG、微调、Agent、多模态RAG 是检索增强生成常用于让大模型结合外部知识库回答问题。微调是继续训练模型让它更适合特定任务或风格。Agent 则强调模型能够规划步骤、调用工具、执行任务。多模态 AI 指模型能处理多种信息形式比如文字、图片、音频、视频。现在很多 AI 产品已经不只是聊天而是能看图、读表、听语音、生成视频。这些概念经常一起出现但解决的问题不同。RAG 补知识微调调能力和风格Agent 做流程多模态扩展输入输出边界。二、从概念到项目读文章时别漏掉这些问题只看定义很容易产生一种错觉好像把名词背下来就已经懂了这项技术。真实情况刚好相反AI 里的很多概念只有放进项目流程里才会变得清楚。建议你读到一个新概念时不要急着问它高级不高级而是先问它解决哪类问题、依赖什么输入、输出如何验证、失败以后谁来兜底。下面这些问题可以当作阅读检查表。你不一定马上能全部回答但只要沿着这些问题去查资料、做实验理解会比单纯刷文章扎实得多。写技术博客时也可以用这套方式展开先讲概念再讲它在系统里处于哪一层最后讲常见坑。围绕「AI、机器学习、深度学习」可以追问三个细节。第一它的输入是什么来自用户、数据库、文档还是传感器第二它的输出怎么被下游使用是直接展示给人还是继续交给另一个模块处理第三它出错时成本有多高。比如本文中提到的场景你可以把 AI 看成“让机器完成智能任务”的领域把机器学习看成“从数据中学习规律”的方法把深度学习看成“用复杂神经网络学习高维数据”的工。如果这个环节没有验证和兜底后面即使接了更强的模型也只是把风险包装得更像一个完整答案。围绕「模型、参数、训练」可以追问三个细节。第一它的输入是什么来自用户、数据库、文档还是传感器第二它的输出怎么被下游使用是直接展示给人还是继续交给另一个模块处理第三它出错时成本有多高。比如本文中提到的场景当你向聊天模型提问时它并不是现场学习全部知识而是利用训练阶段形成的参数再结合当前输入生成回答。。如果这个环节没有验证和兜底后面即使接了更强的模型也只是把风险包装得更像一个完整答案。围绕「Token、上下文、窗口长度」可以追问三个细节。第一它的输入是什么来自用户、数据库、文档还是传感器第二它的输出怎么被下游使用是直接展示给人还是继续交给另一个模块处理第三它出错时成本有多高。比如本文中提到的场景如果你把一本书全部塞给模型超过窗口的部分就无法同时参与推理。很多长文档问答、合同分析、代码库理解都要面对上下文限制。。如果这个环节没有验证和兜底后面即使接了更强的模型也只是把风险包装得更像一个完整答案。围绕「Prompt 与系统提示词」可以追问三个细节。第一它的输入是什么来自用户、数据库、文档还是传感器第二它的输出怎么被下游使用是直接展示给人还是继续交给另一个模块处理第三它出错时成本有多高。比如本文中提到的场景比如让模型“写一篇文章”和“面向 Java 后端新手写一篇 3000 字技术博客包含目录、示例、误区和总结”效果肯定不同。。如果这个环节没有验证和兜底后面即使接了更强的模型也只是把风险包装得更像一个完整答案。围绕「幻觉、事实校验、引用来源」可以追问三个细节。第一它的输入是什么来自用户、数据库、文档还是传感器第二它的输出怎么被下游使用是直接展示给人还是继续交给另一个模块处理第三它出错时成本有多高。比如本文中提到的场景在写作、头脑风暴、代码解释中幻觉风险可以通过人工检查降低在法律、医疗、金融、企业制度等场景必须接入权威资料和校验流程。。如果这个环节没有验证和兜底后面即使接了更强的模型也只是把风险包装得更像一个完整答案。围绕「Embedding、向量数据库、语义搜索」可以追问三个细节。第一它的输入是什么来自用户、数据库、文档还是传感器第二它的输出怎么被下游使用是直接展示给人还是继续交给另一个模块处理第三它出错时成本有多高。比如本文中提到的场景向量数据库负责存储和检索这些向量是知识库问答、推荐系统、相似图片搜索的重要基础。。如果这个环节没有验证和兜底后面即使接了更强的模型也只是把风险包装得更像一个完整答案。围绕「RAG、微调、Agent、多模态」可以追问三个细节。第一它的输入是什么来自用户、数据库、文档还是传感器第二它的输出怎么被下游使用是直接展示给人还是继续交给另一个模块处理第三它出错时成本有多高。比如本文中提到的场景多模态 AI 指模型能处理多种信息形式比如文字、图片、音频、视频。现在很多 AI 产品已经不只是聊天而是能看图、读表、听语音、生成视频。。如果这个环节没有验证和兜底后面即使接了更强的模型也只是把风险包装得更像一个完整答案。三、一个贴近真实场景的例子假设你要给公司做一个“销售知识助手”。用户问产品价格、合同条款、竞品对比和客户案例。只接一个聊天模型很快会遇到问题模型不知道公司最新资料回答没有来源还可能把不同版本政策混在一起。更合理的方案是把产品文档、报价规则、案例库切分后做 Embedding存入向量数据库用户提问时先检索相关资料再把资料片段和问题一起交给大模型生成回答最后展示引用来源并记录用户反馈。如果销售还希望它自动生成拜访计划、创建 CRM 任务、发送邮件草稿那就进入 Agent 范围。你会发现理解这些概念后一个 AI 产品该怎么拆解就清楚多了。四、常见误区误区 1以为会用聊天框就等于懂 AI工具熟练很重要但基础概念能帮助你判断边界。否则工具一换、场景一复杂就不知道问题出在哪里。误区 2把所有问题都交给大模型搜索、数据库、规则引擎、工作流仍然有价值。AI 应用通常是组合系统而不是单个模型包打天下。误区 3忽略成本和延迟长上下文、大模型、多轮调用都会增加成本。产品设计时要考虑哪些问题值得调用大模型哪些可以缓存或用小模型处理。误区 4不做权限控制企业知识库问答必须考虑用户能看哪些文档。检索阶段泄露资料比模型回答错误更危险。五、怎么继续学或落地先记住概念关系用一张图整理模型、Prompt、上下文、Embedding、RAG、Agent、微调之间的关系。用同一问题测试工具拿一个真实业务问题分别测试普通聊天、带资料聊天、RAG 问答观察差异。关注失败案例当模型答错时判断是问题没问清、资料没检索到、模型推理错还是业务规则本身冲突。学一点成本意识理解 Token、模型规格、调用次数和缓存机制对做产品和写方案都很有帮助。持续更新词库AI 领域变化快但基础概念会反复出现。新词先判断它解决什么问题不要只看包装。小结普通人学习 AI不必一开始陷入数学公式但不能只停留在“会问问题”。你至少要知道模型如何接收输入、上下文有什么限制、知识从哪里来、结果如何验证、系统怎样落地。当你掌握这些基础概念后再看 ChatGPT、知识库、智能体、代码助手、多模态生成就会从“觉得厉害”变成“知道为什么厉害也知道哪里不可靠”。这才是真正入门。