重新思考反向传播：对反向传播不足之处的思考

社区文章发布于2024年12月2日

作为一名年轻的研究者，我经常思考反向传播的局限性，特别是当它与人类大脑学习方式进行映射时。尽管反向传播一直是深度学习的主力，但它并非没有缺陷。在这篇文章中，我旨在从第一性原理的角度，分享一些关于这些缺陷的思考。

首先，反向传播究竟是做什么的？本质上，它是一种学习算法，用于计算损失函数相对于神经网络权重的梯度，从而允许我们使用梯度下降来优化这些权重。

考虑上面的神经网络，它接收输入 x_i 和对应的权重 w_ij。神经元 j 的净输入由以下公式给出

然后，我们将这个加权和通过激活函数 ϕ 和附加的偏置 θj，以弥补神经元的阈值

现在，反向传播计算损失 L 相对于这些权重 w_ij 的梯度

其中 δ 是神经元 j 的误差信号，它以递归方式反向计算。

但是，如果激活函数 ϕ 不可微分或包含一个未知函数，会发生什么呢？我们无法计算 ϕ，整个过程就会停止。

有趣且有启发性的是：作为大脑皮层如何学习的模型，反向传播在生物学上是不可信的。

“尽管人们为实现生物学上可信的反向传播付出了巨大的努力，但没有令人信服的证据表明皮层明确地传播误差导数或存储神经活动以供后续反向传递使用。”——杰弗里·辛顿（前向-前向算法）

神经科学家认为，大脑依赖于局部、赫布学习规则——通常概括为“同步放电的细胞连接在一起”。突触强度变化基于突触前和突触后神经元的同步激活。

这种局部学习不需要全局误差信号或对整个网络中所有突触权重的精确了解。

强化学习：我们不需要的英雄当反向传播失败时，你可能会认为强化学习（RL）可以拯救世界。毕竟，RL不需要中间计算的梯度信息，对吗？

嗯，没那么快。

强化学习算法通常依赖于基于奖励的梯度估计，这会在更新中引入高方差。对于大型神经网络，这种方差变得难以控制。

反向传播已经很好地为我们服务了，但它并非没有缺点。通过重新思考我们的方法并更紧密地从大脑中汲取灵感，我们可能会发现训练神经网络的全新算法。

局部、生物学上可信的学习机制能否取代反向传播？我们如何构建能够适应不确定性、未知性、适应性和现实世界限制的算法？

如果大脑不进行反向传播，那神经网络为什么要呢？:)

通过拖放到文本输入框、粘贴或点击此处上传图片、音频和视频。

点击或粘贴此处以上传图片

· 注册或登录发表评论