AI发展历史
https://www.bilibili.com/video/BV1E7wtzaEdq/?spm_id_from333.337.search-card.all.clickvd_source52a37eb8bc66bd0789316767444c7037一、底层引擎大语言模型(LLM)核心定义与架构LLM全称Large Language Model大语言模型简称大模型底层架构基于Transformer2017年Google团队在论文《Attention is All You Need》中提出工作原理本质是文字接龙游戏通过预测下一个概率最高的词生成连续文本发展里程碑时间事件意义2017年Transformer架构提出奠定大模型技术基础2022年底GPT-3.5发布首个达到可用级别的大模型2023年3月GPT-4发布大幅提升AI能力天花板2023年后Claude、Gemini等模型涌现AI赛道从OpenAI独角戏变为多强竞争二、数据处理单元Token核心特性定义大模型处理文本的最小单位通过Tokenizer分词器将文本切分为片段编码过程分两步——①文本切分为Token ②映射为Token ID数字解码过程将Token ID还原为文本无需切分步骤Token与自然语言单位的关系语言单位与Token的关系示例中文词语非一一对应可能被拆分“工作坊”→“工作”“坊”英文单词常见词通常对应1个Token“hello”→1个Token复杂单词可能被拆分“helpful”→“help”“ful”特殊字符可能需多个Token表示“✅”→3个Token二、数据处理单元Token核心特性定义大模型处理文本的最小单位通过Tokenizer分词器将文本切分为片段编码过程分两步——①文本切分为Token ②映射为Token ID数字解码过程将Token ID还原为文本无需切分步骤Token与自然语言单位的关系语言单位与Token的关系示例中文词语非一一对应可能被拆分“工作坊”→“工作”“坊”英文单词常见词通常对应1个Token“hello”→1个Token复杂单词可能被拆分“helpful”→“help”“ful”特殊字符可能需多个Token表示“✅”→3个Token量化参考1个Token ≈ 0.75个英文单词1个Token ≈ 1.5-2个汉字40万Token ≈ 60-80万汉字 或 30万英文单词Token在线查询工具可直接使用1. 官方精准分词工具推荐OpenAI 官方 Tokenizer可实时查看分词细节、精准统计 Token 数量https://platform.openai.com/tokenizer2. 国内免翻墙在线工具无需登录、无需翻墙支持 GPT / Claude / Gemini 全模型统计https://toolsonline.run/zh/token-calculatorhttps://tools.jlvextension.com/token-counter/3. 本地Python精准统计代码适合批量、本地离线统计 Token 数量安装依赖pip install tiktokenimport tiktoken加载GPT分词器enc tiktoken.get_encoding(“cl100k_base”)待统计文本text “在此粘贴你的文本内容”计算Token数量token_count len(enc.encode(text))print(f当前文本Token数量{token_count})三、临时记忆体Context核心概念定义大模型每次处理任务时接收的信息总和相当于模型的临时记忆组成部分用户问题、对话历史、当前输出Token、工具列表、System Prompt等容量限制由Context Window上下文窗口定义即最大可处理的Token数量主流模型Context Window对比模型Context WindowToken约合汉字数量GPT-5.4105万约157.5万Gemini 3.1 Pro100万约150万Claude Opus 4.6100万约150万突破Context Window限制的方案RAG技术检索增强生成从知识库中抽取与问题最相关的片段仅将关键信息送入模型降低Token消耗四、指令交互Prompt定义与分类Prompt给大模型的问题或指令决定模型输出质量Prompt分类User Prompt用户输入的具体任务如帮我写一首诗System Prompt开发者后台配置的人设与做事规则如你是一个耐心的数学老师当学生问你数学问题时不要直接给答案而是要一步步引导学生思考帮助他们理解解题的思路Prompt Engineering提示词工程核心原则清晰、具体、明确现状曾经重要但现在重要性下降原因①门槛低本质是把话说清楚②大模型能力提升可推测模糊意图五、外部能力扩展Tool核心作用定义大模型调用的外部函数使其能够感知和影响外部环境解决痛点弥补大模型无法获取实时信息如天气、计算能力有限等弱点工作流程用户提问→平台转发含工具列表大模型分析→生成工具调用指令平台执行调用→获取结果大模型整理结果→自然语言输出角色分工角色职责大模型选择工具、生成参数、归纳结果工具执行具体功能如查询天气平台转发信息、执行工具调用六、工具标准化MCP全称Model Context Protocol模型上下文协议本质理解为统一的工具接入标准解决不同平台工具接入规范不统一的问题。比如openAI、Anthropic、Google三个平台各自有接入规范用一个要写一个接入规范。所以想搞一个统一的技术规范标准。就像手机都统一用type c充电口统一标准价值工具开发者只需按MCP规范开发一次即可在所有支持MCP的平台使用类比手机Type-C接口七、自主决策系统AgentAgent定义能够自主规划、自主调用工具持续工作直至完成用户任务的系统核心能力多步骤推理、工具选择、流程控制代表产品Claude Code、Codex、Gemini CLI等典型构建模式React、Plan and Execute等八、任务定制Agent Skill核心功能定义给Agent的说明文档包含任务规则、执行步骤、输出格式等结构元数据层名称name、描述description指令层目标、执行步骤、判断规则、输出格式、示例技术实现存储形式Markdown文档文件名必须为SKILL.md存放位置特定目录如Claude Code找到用户目录的claude/skills文件夹加载机制仅在用户问题与技能名称/描述相关时加载完整指令九、概念体系关联[概念体系层级关系]LM核心引擎→Token数据单位→Context记忆空间→Prompt交互接口→Tool外部能力→MCP工具标准→Agent决策系统→Agent Skill任务定制补充细节Transformer架构虽由Google提出但由OpenAI通过GPT系列引爆应用Token切分原理基于BPE字节对编码算法模型自主学习的文本切分规则Agent Skill高级特性支持运行代码、引用资源采用渐进式披露机制节省TokenRAG技术通过检索相关片段而非全文有效解决Context Window限制问题