深度学习100问32:什么是梯度消失

2025/2/23 6:31:48 来源：https://blog.csdn.net/yyq916/article/details/141717247 浏览: 次关键词：深度学习100问32:什么是梯度消失

嘿，咱来聊聊梯度消失是啥。想象一下有一群小伙伴站成一排玩传话游戏。第一个小伙伴有个超重要的消息要传给最后一个小伙伴。可是呢，每传一次话，这个消息就会变弱那么一点点。等传到最后一个小伙伴那儿的时候，可能消息已经变得超级微弱，甚至都消失不见了。

在神经网络里呀，梯度消失就跟这个传话游戏有点像。在反向传播的时候，就好像信息在网络中传递。随着网络层数越来越多，就像传话的队伍越来越长。这个时候，那个代表误差信息的梯度在传播过程中就会逐渐变小。这会让靠近输入层的那些神经元很难根据误差来调整自己的“本事”（权重）。结果呢，整个网络就不好训练啦。

简单来讲，梯度消失就像是在一个长长的管道里传递信号，信号在传递的过程中不断减弱，最后可能就完全没了，这可就大大影响了网络的学习效果哟。

深度学习100问32:什么是梯度消失

最新新闻

热搜词