神经网络

一、什么是神经网络？先别急着看公式

神经网络是一种用大量可调参数，把输入映射为输出的函数模型。它的本质不是大脑，而是一个可学习的、多层嵌套的数学函数。想象你有一个线性公式：y=ax+b，你不知道 a 和 b但你有大量 (x, y) 数据，神经网络 = 把这个公式变得非常复杂 + 自动帮你调参数。不同点在于：

线性模型	神经网络
参数很少	参数非常多
结构简单	多层嵌套
表达能力有限	能拟合复杂关系

为什么需要“神经网络”这种模型？现实中往往会遇到这样的问题：

分子结构预测毒性
光谱数据预测化学性质
图像数据预测类别

这些问题往往有共性：

非线性
高维

无明确公式

神经网络擅长在没有明确机理公式的情况下，逼近复杂映射关系。

二、神经网络的整体结构

understanding layers in dl : input, hidden, and output layers | by Sirine Amrane | Medium

一个最基础的神经网络包含三部分：输入层、隐藏层（1个或多个）、输出层。

三、神经网络中最核心的7个概念

这7个概念是所有深度学习模型的共同概念。

1. 神经元（Neuron）

神经元是什么？神经元是一个带参数的计算单元。

数学表达：

我们需要记住的不是公式，而是神经元会：

接收输入
加权求和
过一个非线性函数（激活函数）

2. 权重（Weights）

权重（上面表达式中的w）可以理解为模型学到的经验，决定某个输入有多重要，神经网络模型训练的本质就是不断调整权重。在科研建模中可以理解为某个结构特征、某个光谱峰、某个描述符对结果的影响强度。

3. 偏置（Bias）

偏置（上面表达式中的b）可以理解为调整整体位置的自由度，没有偏置的话，模型被迫从原点出发，使其表达能力受限。一句话理解就是权重决定斜率，偏置决定平移。

4. 激活函数（Activation Function）

激活函数（上面表达式中的φ）就是在神经网络的神经元上运行的函数，为什么一定要它？如果没有激活函数，多层神经网络 ≈ 一堆线性模型的线性组合。核心作用就是引入非线性，让模型能学复杂的关系。

常见激活函数：

名称	作用
ReLU	默认首选，简单稳定
Sigmoid	概率输出
Tanh	中心化输出

5. 层（Layer）

什么是一层？一层 = 一组并行的神经元

输入层：不做计算
隐藏层：特征变换
输出层：给出最终结果

多层的意义：逐层抽象特征，从原始特征到中间表征，再到高级表征。

6. 参数（Parameters）

参数 = 所有权重 + 偏置，一个看似简单的网络，参数可能是几千、几百万甚至几十亿（大模型），非常重要的一点：神经网络不是结构复杂，而是参数多。

7. 模型（Model）

当你确定了、网络结构（多少层、多少神经元）、激活函数、参数初始值，你就得到了一个可以被训练的函数模型。

四、真正需要理解的是什么？

不是公式，而是这 3 点：

神经网络 ≠ 智能，它只是一个可调参数的函数；
深度学习的深度，来自多层特征变换；

学习的本质调参数，让输出更准。

菜单