一、什么是神经网络?先别急着看公式
神经网络是一种用大量可调参数,把输入映射为输出的函数模型。它的本质不是大脑,而是一个可学习的、多层嵌套的数学函数。想象你有一个线性公式:y=ax+b,你不知道 a 和 b但你有大量 (x, y) 数据,神经网络 = 把这个公式变得非常复杂 + 自动帮你调参数。不同点在于:
为什么需要“神经网络”这种模型?现实中往往会遇到这样的问题:
分子结构预测毒性
光谱数据预测化学性质
图像数据预测类别
这些问题往往有共性:
非线性
高维
无明确公式
神经网络擅长在没有明确机理公式的情况下,逼近复杂映射关系。
二、神经网络的整体结构
一个最基础的神经网络包含三部分:输入层、隐藏层(1个或多个)、输出层。
三、神经网络中最核心的7个概念
这7个概念是所有深度学习模型的共同概念。
1. 神经元(Neuron)
神经元是什么?神经元是一个带参数的计算单元。
数学表达:
我们需要记住的不是公式,而是神经元会:
接收输入
加权求和
过一个非线性函数(激活函数)
2. 权重(Weights)
权重(上面表达式中的w)可以理解为模型学到的经验,决定某个输入有多重要,神经网络模型训练的本质就是不断调整权重。在科研建模中可以理解为某个结构特征、某个光谱峰、某个描述符对结果的影响强度。
3. 偏置(Bias)
偏置(上面表达式中的b)可以理解为调整整体位置的自由度,没有偏置的话,模型被迫从原点出发,使其表达能力受限。一句话理解就是权重决定斜率,偏置决定平移。
4. 激活函数(Activation Function)
激活函数(上面表达式中的φ)就是在神经网络的神经元上运行的函数,为什么一定要它?如果没有激活函数,多层神经网络 ≈ 一堆线性模型的线性组合。核心作用就是引入非线性,让模型能学复杂的关系。
常见激活函数:
5. 层(Layer)
什么是一层?一层 = 一组并行的神经元
输入层:不做计算
隐藏层:特征变换
输出层:给出最终结果
多层的意义:逐层抽象特征,从原始特征到中间表征,再到高级表征。
6. 参数(Parameters)
参数 = 所有权重 + 偏置,一个看似简单的网络,参数可能是几千、几百万甚至几十亿(大模型),非常重要的一点:神经网络不是结构复杂,而是参数多。
7. 模型(Model)
当你确定了、网络结构(多少层、多少神经元)、激活函数、参数初始值,你就得到了一个可以被训练的函数模型。
四、真正需要理解的是什么?
不是公式,而是这 3 点:
神经网络 ≠ 智能,它只是一个可调参数的函数;
深度学习的深度,来自多层特征变换;
学习的本质调参数,让输出更准。