您的位置:首页 > 汽车 > 新车 > 国家专业分类目录_福州seo外包公司_seo页面优化的方法_俄罗斯搜索引擎浏览器官网入口

国家专业分类目录_福州seo外包公司_seo页面优化的方法_俄罗斯搜索引擎浏览器官网入口

2024/10/5 15:24:58 来源:https://blog.csdn.net/weixin_41838721/article/details/142653342  浏览:    关键词:国家专业分类目录_福州seo外包公司_seo页面优化的方法_俄罗斯搜索引擎浏览器官网入口
国家专业分类目录_福州seo外包公司_seo页面优化的方法_俄罗斯搜索引擎浏览器官网入口

Transformer学习

  • 梯度消失
  • FeedForward层

激活函数的主要作用是在网络中加入非线性变换

梯度消失

梯度爆炸

FeedForward层

Transformer结构:
Transformer结构主要分为两大部分:

  • 一是Encoder层结构:Encoder 的输入由 Input Embedding 和 Positional Embedding 求和输入Multi-Head-Attention,然后又做了一个ADD&Norm,再通过Feed Forward进行输出
  • 另一个则是Decoder层结构

在这里插入图片描述
FeedForward的输入:是Multi-Head Attention的输出做了残差连接和Norm之后得数据,然后FeedForward做了两次线性线性变换,为的是更加深入的提取特征。
在这里插入图片描述
它由两个线性变换组成,中间有一个 ReLU 激活
在Multi-Head Attention中,主要是进行矩阵乘法,即都是线性变换,而线性变换的学习能力不如非线性变换的学习能力强,FeedForward的计算公式如下:max相当于Relu

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com