AI相关术语及开发技术路线详解
大模型LLM通过海量数据训练能理解和生成自然语言但存在“幻觉”问题。文章介绍了LLM的核心能力与局限并深入解析了Embedding、RAG、MCP、Function Calling、AI Agent等关键技术同时探讨了自监督学习、强化学习、微调、Prompt Engineering、量化、上下文窗口等训练与优化方法。这些技术共同推动了AI应用的发展为企业知识库、AI客服等领域提供了强大支持。大模型大模型是用海量文本数据训练出来的深度神经网络参数量通常在百亿到千亿级别。参数可以理解为模型在训练过程中学到的知识的存储单元数量越多模型能记住和处理的模式越复杂。LLM 的核心能力是理解和生成自然语言。它不是在检索答案而是在根据上下文预测接下来最合理的内容是什么。这个机制决定了它的优势——灵活、泛化能力强也决定了它的局限——可能一本正经地生成错误内容幻觉。现在主流的 LLM 分两类闭源 APIGPT-4o、Claude、Gemini和开源模型Llama、Qwen、Mistral。前者开箱即用后者可以本地部署、私有化。Embedding向量嵌入Embedding 是把文本转换成数字向量的技术。一段文字经过 Embedding 模型处理后变成一个高维空间里的坐标点语义相近的内容在这个空间里距离也更近。这个技术是语义搜索和 RAG 的底层基础。传统关键词搜索只能匹配字面Embedding 能理解苹果手机和iPhone说的是同一件事。不同的 Embedding 模型输出的向量维度不同精度和速度也有差异。OpenAI 的 text-embedding-3-small 是常用选择开源的 BGE 系列在中文上表现更好。RAG检索增强生成LLM 的训练数据有截止日期也不知道你的私有文档里写了什么。RAG 解决的就是这个问题。流程是用户提问 → 把问题转成向量 → 在向量数据库里找相关文档 → 把检索结果拼进 prompt → LLM 基于这些内容生成回答。这样 LLM 的回答有了实际的信息来源不再完全依赖训练时学到的知识也能处理实时数据和私有数据。现在大多数企业知识库、AI 客服底层都是这套架构。RAG 的效果很大程度上取决于检索质量而不只是生成模型的能力。检索到的内容不相关LLM 再强也没用。MCPModel Context ProtocolMCP 是 Anthropic 2024 年底推出的开放协议定义的是 AI 应用和外部工具之间的通信标准。在 MCP 之前每个 AI 应用想接入工具数据库、文件系统、第三方 API都要自己实现一套对接逻辑格式不统一工具也没法复用。MCP 把这套接口标准化了,工具提供方实现 MCP ServerAI 应用实现 MCP Client两边按协议通信。对普通用户来说最直观的体验是 Claude Desktop 或 Cursor 接入 MCP Server 之后AI 可以直接读写本地文件、查询数据库、操作 GitHub不需要手动复制粘贴。社区已经有大量现成的 MCP Server 可以直接用。Function Calling / Tool Use让 LLM 在对话过程中调用外部函数的机制。你定义好函数的名称、参数和描述LLM 判断什么时候需要调用输出结构化的调用请求你的代码执行后把结果返回给 LLM它再基于结果继续回答。有个常见误区LLM 并不直接执行函数只是输出我需要调用什么、参数是什么。执行权始终在调用方代码里LLM 看不到也碰不到真实系统。Function Calling 是 LLM API 层面的能力MCP 是工具集成的协议标准两者不是同一层的东西。MCP Server 对外暴露的工具最终也是通过 Function Calling 机制被 LLM 调用的。AI AgentAgent 是能自主规划、调用工具、多步执行任务的系统不是单次问答。最基础的运行模式是 ReAct思考当前状态 → 决定下一步行动 → 执行工具调用 → 观察结果 → 再思考循环直到任务完成。LLM 在每一步充当大脑决定做什么工具负责实际执行。Agent 的核心组件是四个Planning任务拆解、Memory上下文和历史记忆、Tools搜索、代码执行、数据库查询等、Action执行并反馈。Agent 的能力上限取决于工具集和底层模型的推理能力。能力越强、权限越大安全风险也越高——攻击者可以在工具返回的内容里嵌入恶意指令让 Agent 执行非预期操作这类攻击叫 prompt injection。自监督学习Self-supervised Learning一种不依赖人工标注数据的训练方式。模型从数据本身构造训练目标不需要人告诉它这个是对的那个是错的。LLM 的预训练就是自监督学习的典型应用——给模型一段文字遮住后面的词让它预测被遮住的部分预测对了就是正反馈。整个互联网的文本都可以用来训练不需要任何人工标签这是 LLM 能做到如此大规模训练的根本原因。理解这个机制有助于理解 LLM 的本质它学到的是在什么上下文后面应该接什么内容而不是真正理解了语言的含义。强化学习Reinforcement LearningRL与 RLHF强化学习让模型通过与环境交互、获得奖励信号来优化行为策略。模型每次行动后得到正向或负向反馈逐渐学会怎么做能拿到更高的奖励。在 LLM 领域RL 主要用于对齐阶段最常见的形式是 RLHF基于人类反馈的强化学习。流程是让人类标注员对模型的多个输出排序 → 训练一个奖励模型学习人类偏好 → 用 RL 算法让 LLM 朝奖励更高的方向优化。ChatGPT 和 Claude 都用了这套方法它解决的是预训练模型输出流畅但可能有害、不诚实的问题。更新的方向是 DPODirect Preference Optimization绕过奖励模型直接优化流程更简单很多开源模型在用。微调Fine-tuning在预训练模型的基础上用特定领域的数据继续训练让模型在这个领域表现更好。预训练模型见过大量通用文本但对医疗、法律、安全这类垂直领域的理解深度有限输出格式也不一定符合业务需求。微调可以注入领域知识也可以固定输出格式和风格。全量微调成本高需要大量 GPU。现在更常用的是 LoRA——只训练模型中少量新增的低秩矩阵参数量大幅减少消费级显卡也能跑效果接近全量微调。实际开发中大多数场景先用 RAG 解决效果不够再考虑微调。微调的数据质量比数量重要。Prompt Engineering不改模型参数通过优化输入来提升输出质量。听起来像技巧但背后有实际的原理支撑。几个有效的方向Few-shot 是在 prompt 里给几个示例让模型照着格式输出Chain of Thought 是让模型先把推理过程写出来再给结论复杂问题准确率明显提升结构化输出是要求模型返回 JSON减少解析成本。System prompt 和 User prompt 要分开用——System prompt 放角色设定和约束User prompt 放具体问题混在一起会降低遵循度。Prompt Engineering 的天花板是模型本身的能力模型不具备的推理能力再好的 prompt 也补不上。量化Quantization把模型参数的数值精度从高压缩到低比如从 32 位浮点数压缩到 8 位或 4 位整数。压缩之后显存占用大幅降低推理速度也会提升代价是精度略有损失。一个原本需要 80GB 显存才能跑的模型量化到 4-bit 之后可能 16GB 就够了。对想在本地跑模型的人来说量化是绕不开的概念。GGUF 格式加上 llama.cpp 是目前本地部署开源模型的主流方案Ollama 把这套流程进一步封装几行命令就能跑起来。上下文窗口Context Window模型单次能处理的最大文本长度单位是 token。超出这个限制多出来的内容会被截断或导致报错。Token 不等于字符英文大约 1 token 对应 0.75 个单词中文一个汉字大约 1-2 个 token。早期模型的上下文窗口只有 4K token现在主流模型普遍在 128K 以上Claude 支持到 200KGemini 1.5 Pro 支持 1M。窗口变大让长文档处理、长对话成为可能但也要注意窗口越长推理成本越高而且模型对窗口中间位置内容的注意力会有所下降。最后我在一线科技企业深耕十二载见证过太多因技术更迭而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我整理出这套 AI 大模型突围资料包✅AI大模型学习路线图✅Agent行业报告✅100集大模型视频教程✅大模型书籍PDF✅DeepSeek教程✅AI产品经理入门资料完整的大模型学习和面试资料已经上传带到CSDN的官方了有需要的朋友可以扫描下方二维码免费领取【保证100%免费】为什么说现在普通人就业/升职加薪的首选是AI大模型人工智能技术的爆发式增长正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议到全国两会关于AI产业发展的政策聚焦再到招聘会上排起的长队AI的热度已从技术领域渗透到就业市场的每一个角落。智联招聘的最新数据给出了最直观的印证2025年2月AI领域求职人数同比增幅突破200%远超其他行业平均水平整个人工智能行业的求职增速达到33.4%位居各行业榜首其中人工智能工程师岗位的求职热度更是飙升69.6%。AI产业的快速扩张也让人才供需矛盾愈发突出。麦肯锡报告明确预测到2030年中国AI专业人才需求将达600万人人才缺口可能高达400万人这一缺口不仅存在于核心技术领域更蔓延至产业应用的各个环节。资料包有什么①从入门到精通的全套视频教程⑤⑥包含提示词工程、RAG、Agent等技术点② AI大模型学习路线图还有视频解说全过程AI大模型学习路线③学习电子书籍和技术文档市面上的大模型书籍确实太多了这些是我精选出来的④各大厂大模型面试题目详解⑤ 这些资料真的有用吗?这份资料由我和鲁为民博士共同整理鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。所有的视频教程由智泊AI老师录制且资料与智泊AI共享相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念通过动态追踪大模型开发、数据标注伦理等前沿技术趋势构建起前沿课程智能实训精准就业的高效培养体系。课堂上不光教理论还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事如果说你是以下人群中的其中一类都可以来智泊AI学习人工智能找到高薪工作一次小小的“投资”换来的是终身受益应届毕业生无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界。业务赋能 突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型。获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】**