第02篇:深度学习核心概念——从感知机到LLM的“中间件“
前置知识:第01篇数学基础 / 基础的 Python 编程经验引言:为什么叫"中间件"?第01篇我们聊了数学"最小够用集"。现在要往前进一层——把数学和代码之间的桥梁搭起来。神经网络的每个组件——激活函数、归一化层、损失函数——在代码里就像是"中间件":它们接受前一层的数据,加工处理,再传递给下一层。你不需要每次自己写它们(PyTorch 都封装好了),但如果你不理解它们各自在干什么,模型训练出问题时你根本不知道从哪里下手。这一篇,我们就来拆解这些"中间件":它们长什么样、为什么这么设计、换一个会怎样。一、前向传播与反向传播:神经网络的"呼吸"1.1 从感知机说起感知机(Perceptron)是最简单的神经网络单元:y = step ( w ⋅ x + b ) y = \text{step}(w \cdot x + b)