从 0 开始学 AI:第 1 课,普通软件和 AI 软件有什么区别?
从 0 开始学 AI第 1 课普通软件和 AI 软件有什么区别1. 为什么要先理解这个问题2. 普通软件是怎么工作的3. AI 软件是怎么工作的4. 普通软件和 AI 软件的核心区别5. AI 的三个核心概念数据、模型、训练5.1 数据5.2 模型5.3 训练6. 训练和推理有什么区别6.1 训练是什么6.2 推理是什么7. AI 不是简单地“查规则”8. 用猫狗识别理解 AI 的完整流程8.5 数据、模型、训练的关系9. 本节课的核心总结10. 本节课的关键词11. 我的阶段理解12. 本节课后的自测问题这一课的最终记忆版1. 为什么要先理解这个问题刚开始学习 AI 的时候最容易被各种名词吓住机器学习 深度学习 大模型 训练 推理 参数Token Embedding GPU RAG Agent但在进入这些复杂概念之前最应该先弄明白一个基础问题AI 软件和普通软件到底有什么区别如果这个问题理解清楚后面学习机器学习、深度学习、大模型时就会轻松很多。2. 普通软件是怎么工作的普通软件的核心特点是人写规则软件执行规则。比如一个简单的折扣计算程序如果订单金额大于 100 元打 9 折。如果订单金额大于 500 元打 8 折。如果订单金额大于 1000 元打 7 折。这些规则都是人提前写好的。软件本身并不会主动学习它只是按照程序员写好的逻辑一步一步执行。再比如一个传统的垃圾邮件判断程序可能会这样写规则如果邮件标题包含“中奖”判断为垃圾邮件。如果邮件内容包含“免费领取”判断为垃圾邮件。如果邮件里有可疑链接判断为垃圾邮件。这种方式的优点是清晰、可控。但缺点也很明显规则需要人不断维护遇到新情况时软件可能就判断不出来。例如垃圾邮件换一种说法恭喜你获得专属福利请立刻查收。如果程序里没有这条规则普通软件可能就识别失败。3. AI 软件是怎么工作的AI 软件的核心特点是不是主要靠人写死规则而是通过数据训练模型让模型从数据中学习规律。还是以垃圾邮件识别为例。普通软件的做法是人写很多判断规则。AI 软件的做法是给模型很多邮件样本这封是垃圾邮件。这封不是垃圾邮件。这封是垃圾邮件。这封不是垃圾邮件。然后让模型从这些样本中学习规律。模型可能会学到什么样的词经常出现在垃圾邮件里什么样的标题更像广告什么样的链接更可疑什么样的语气更像营销内容训练完成后再来一封新邮件模型就可以根据学到的规律判断它是不是垃圾邮件。4. 普通软件和 AI 软件的核心区别可以用一句话概括普通软件是规则驱动AI 软件是数据驱动。也可以这样理解普通软件人告诉机器规则机器按规则执行。AI 软件人提供数据和目标机器从数据中学习规律。对比如下对比项普通软件AI 软件核心方式人写规则数据训练模型规则来源程序员提前定义模型从数据中学习适合任务规则明确、流程固定的任务规律复杂、难以手写规则的任务典型例子计算器、订单系统、表单系统图像识别、语音识别、推荐系统、聊天机器人遇到新情况可能需要修改代码可能通过更多数据继续优化下面的架构图展示了普通软件与AI软件在系统设计上的根本差异AI软件系统数据驱动训练数据模型训练学习规律模型参数存储规律推理引擎输出结果新输入数据普通软件系统人工维护人工编写规则规则库if-else逻辑执行引擎输出结果5. AI 的三个核心概念数据、模型、训练理解 AI先抓住三个关键词数据 模型 训练5.1 数据数据是 AI 学习的材料。比如图片 文本 语音 视频 用户点击记录 交易记录 医学影像 传感器数据没有数据AI 就很难学习规律。例如要训练一个识别猫狗的 AI就需要大量猫和狗的图片。5.2 模型模型可以先理解成一个能够从数据中学习规律并对新输入做出判断或生成内容的系统。不同任务会有不同模型垃圾邮件识别模型判断邮件是不是垃圾邮件。图像识别模型判断图片里是什么。语音识别模型把声音转成文字。推荐模型预测用户可能喜欢什么。大语言模型根据上下文生成回答。在 AI 里模型不是普通意义上的“模型玩具”而是一个由大量参数组成的计算系统。5.3 训练训练就是让模型通过大量数据不断学习规律的过程。训练过程可以简单理解为是否模型先做预测拿预测结果和正确答案比较发现错误调整内部参数训练完成/继续优化经过大量重复后模型就会越来越擅长某类任务。例如猫狗识别模型一开始可能分不清猫和狗。经过大量猫狗图片训练后它会逐渐学会猫和狗在耳朵、脸型、身体结构、毛发、姿态等方面的区别。6. 训练和推理有什么区别学习 AI 时经常会遇到两个词训练 推理这两个词非常重要。6.1 训练是什么训练是模型学习的过程。例如给模型看大量猫狗图片让它学习猫和狗的区别。训练通常需要大量数据较长时间较高算力不断调整模型参数训练的目标是让模型掌握某类任务的规律。6.2 推理是什么推理是使用训练好的模型处理新输入。例如模型已经学过很多猫狗图片。 现在给它一张新的图片。 它判断这张图片是猫还是狗。这个判断过程就是推理。也可以理解成训练学习阶段。推理使用阶段。举例场景训练推理猫狗识别看大量猫狗图片学习区别输入一张新图片判断猫或狗垃圾邮件识别看大量邮件样本学习垃圾邮件特征判断一封新邮件是否是垃圾邮件大语言模型从大量文本中学习语言规律用户输入问题模型生成回答语音识别学习大量语音和文字对应关系把一段新语音转成文字7. AI 不是简单地“查规则”很多人刚开始会以为 AI 只是在查规则库。其实不是。普通软件更像这样如果 A就执行 B。如果 C就执行 D。AI 更像这样看过大量样本后学到某种规律。遇到新情况时根据学到的规律做判断。需要注意的是AI 学到的规律不一定会以人类能直接读懂的规则形式存在。比如一个猫狗识别模型它不一定会明确写出耳朵尖的是猫。嘴巴长的是狗。胡须明显的是猫。它更可能是在大量图片中学习到复杂的特征组合然后根据这些特征综合判断。所以AI 不是简单地查固定规则而是通过数据学习统计规律并把这些规律保存在模型的内部参数里。8. 用猫狗识别理解 AI 的完整流程假设我们要训练一个能识别猫和狗的 AI。整个过程大概是否是准备大量猫狗图片给每张图片打标签猫 / 狗把图片输入模型模型做出预测对比预测结果和正确标签预测是否正确根据错误调整模型参数重复训练很多次得到训练好的猫狗识别模型输入一张新图片模型判断猫或狗这里面有几个关键点图片数量要足够多。图片最好要有正确标签。图片要尽量多样化。模型需要经过反复训练。训练完成后模型才能对新图片进行推理。如果训练数据太单一模型可能会学偏。比如训练数据里的猫都是白色的狗都是黑色的那么模型可能误以为白色 猫黑色 狗这就说明数据质量会直接影响 AI 的效果。8.5 数据、模型、训练的关系理解AI的三个核心概念数据、模型、训练之间的关系至关重要输出处理输入数据训练材料模型学习系统训练学习过程推理能力处理新输入三者关系说明数据是燃料为模型提供学习材料训练是引擎驱动模型从数据中学习模型是容器存储学习到的规律推理是应用使用训练好的模型处理新任务这个闭环体现了AI系统的核心工作原理用数据训练模型让模型具备推理能力。9. 本节课的核心总结这一课最重要的是理解四句话普通软件主要靠人写规则。AI 软件主要靠数据训练模型。训练是让模型学习规律。推理是使用训练好的模型处理新输入。再进一步可以总结成一句话普通软件是规则驱动AI 软件是数据驱动。AI 通过数据训练模型让模型学习规律再用训练好的模型处理新的输入。10. 本节课的关键词关键词简单解释数据AI 学习的材料模型从数据中学习规律的系统训练让模型通过数据学习规律推理使用训练好的模型处理新输入参数模型内部可调整的数值标签训练数据对应的正确答案规则驱动人写规则机器执行数据驱动机器从数据中学习规律11. 我的阶段理解通过这一课我对 AI 有了一个初步认识普通软件是人为指定规则软件按照指令执行。AI 软件不是主要靠人写死规则而是通过大量数据训练模型让模型学习数据中的规律。训练完成后模型可以对新的输入进行判断、预测或生成内容。以猫狗识别为例训练时需要给模型大量带标签的猫狗图片让它学习猫和狗的区别。训练完成后再输入一张新的动物图片模型就可以根据之前学到的规律判断图片中是猫还是狗。12. 本节课后的自测问题可以用下面几个问题检查自己是否理解普通软件和 AI 软件最大的区别是什么什么是训练什么是推理为什么说 AI 不是简单查规则如果要训练一个识别猫狗图片的 AI需要准备什么数据如果能用自己的话回答这些问题就说明已经掌握了本节课的核心内容。这一课的最终记忆版你可以把下面这段作为最精简的复习卡片普通软件人写规则机器执行规则。AI 软件人提供数据模型从数据中学习规律。训练模型通过大量数据学习规律并调整内部参数。推理模型训练完成后利用学到的规律处理新输入。AI 不是简单查规则而是通过数据学习复杂规律。 训练猫狗识别模型需要大量带标签的猫狗图片。这节课你已经掌握得不错。下一课可以进入AI、机器学习、深度学习、大模型之间到底是什么关系。