您的位置:首页 > 游戏 > 游戏 > 网页设计需要什么专业_网络推广公司有哪些_移动端seo关键词优化_江门关键词排名工具

网页设计需要什么专业_网络推广公司有哪些_移动端seo关键词优化_江门关键词排名工具

2025/1/15 8:38:56 来源:https://blog.csdn.net/qq_74062041/article/details/144142224  浏览:    关键词:网页设计需要什么专业_网络推广公司有哪些_移动端seo关键词优化_江门关键词排名工具
网页设计需要什么专业_网络推广公司有哪些_移动端seo关键词优化_江门关键词排名工具

1.实现SRN简单循环网络

(1)使用numpy

 代码:
 

import numpy as np
inputs=np.array([[1.,1.],[1.,1.],[2.,2.]])#初始化输入序列
print('inputs is ',inputs)
state_t=np.zeros(2,)#初始化存储器
print('state_t is ',state_t)
w1,w2,w3,w4,w5,w6,w7,w8=1.,1.,1.,1.,1.,1.,1.,1.
U1,U2,U3,U4=1.,1.,1.,1.
print('----------------------')
for input_t in inputs:print('inputs is ', input_t)print('state_t is ', state_t)in_h1=np.dot([w1,w3],input_t)+np.dot([U2,U4],state_t)in_h2=np.dot([w2,w4],input_t)+np.dot([U1,U3],state_t)state_t=in_h1,in_h2output_y1=np.dot([w5,w7],[in_h1,in_h2])output_y2=np.dot([w6,w8],[in_h1,in_h2])print('output_y is',output_y1,output_y2)print('-------------')

 其实就是两个全连接,一个是输入的全连接,一个是隐层的全连接

(2)在1的基础上,增加激活函数tanh

import numpy as np
inputs=np.array([[1.,1.],[1.,1.],[2.,2.]])#初始化输入序列
print('inputs is ',inputs)
state_t=np.zeros(2,)#初始化存储器
print('state_t is ',state_t)
w1,w2,w3,w4,w5,w6,w7,w8=1.,1.,1.,1.,1.,1.,1.,1.
U1,U2,U3,U4=1.,1.,1.,1.
print('----------------------')
for input_t in inputs:print('inputs is ', input_t)print('state_t is ', state_t)in_h1=np.tanh(np.dot([w1,w3],input_t)+np.dot([U2,U4],state_t))in_h2=np.tanh(np.dot([w2,w4],input_t)+np.dot([U1,U3],state_t))state_t=in_h1,in_h2output_y1=np.dot([w5,w7],[in_h1,in_h2])output_y2=np.dot([w6,w8],[in_h1,in_h2])print('output_y is',output_y1,output_y2)print('-------------')

 

(3)使用nn.RNNCell实现

 

import torch
import numpy as np
batch_size=1
seq_len=3
input_size=2
hidden_size=2
output_size=2
cell=torch.nn.RNNCell(input_size=input_size,hidden_size=hidden_size)
#初始化参数
for name,param in cell.named_parameters():if name.startswith("weight"):torch.nn.init.ones_(param)else:torch.nn.init.zeros_(param)# 线性层  隐藏层到输出层
liner=torch.nn.Linear(hidden_size,output_size)
liner.weight.data=torch.Tensor([[1,1],[1,1]])
liner.bias.data=torch.Tensor([0,0])dataset=torch.Tensor([[[1.,1.]],[[1.,1.]],[[2.,2.]]])#初始化输入序列
hidden=torch.ones(batch_size,hidden_size)
output=torch.zeros(batch_size,output_size)
for idx,input in enumerate(dataset):print('='*20,idx,'='*20)print('input size:',input.shape)hidden=cell(input,hidden)print('outputs size:',hidden.shape)print(hidden)output=liner(hidden)print(output)

(4)使用nn.RNN实现

import torch
batch_size=1
seq_len=3
input_size=2
hidden_size=2
output_size=2
num_layers=1
cell=torch.nn.RNN(input_size=input_size,hidden_size=hidden_size,num_layers=num_layers)
# inputs=torch.randn(seq_len,batch_size,input_size)
# inputs=torch.randn(batch_size,seq_len,input_size)#先设置批量,可能有时候方便
input=torch.Tensor([[[1.,1.]],[[1.,1.]],[[2.,2.]]])#初始化输入序列
hidden=torch.zeros(num_layers,batch_size,hidden_size)
output=torch.zeros(batch_size,output_size)
hidout,hidden=cell(input,hidden)
print('hidout size:',hidout.shape)
print('hidout:',hidout)
print('hidden size:',hidden.shape)
print("hidden:",hidden)
liner=torch.nn.Linear(hidden_size,output_size)
liner.weight.data=torch.Tensor([[1,1],[1,1]])
liner.bias.data=torch.Tensor([0,0])
output=liner(hidden)
print('output size:',output.shape)
print("output:",output)

2.实现“序列”到“序列”

观看视频,学习RNN原理,并实现视频P12中的教学案例

视频总结:

RNN通常处理序列类型的数据,天气、股市、自然语言

RNNCell:

在某个时刻t,把某个三维的数据转换为5维的数据,其实本质上就是一个线性层

那RNN和线性层有什么区别呢,那就是RNN是共享的,用下面的图理解

 x2产生的h2不仅要包含x2的信息,还要包含x1的信息。那这个怎么实现呢?输入序列送到RNN会产生输出hidden,此外这个输出还会传给下一项,例如x1产生h1之后,还会把h1传递给下一项,然后x2会和h1一起产生h2。这些绿色的格都是同一层

理解函数RNNCell的内部原理:

RNNCell内部就是输入乘以权重加上隐层乘以权重,相加再激活,其实就是典型的线性层

输入的权重W的大小是Input_size*hidden_size,隐层的w的大小是hidden_size*hidden_size

 定义RNNCell时要有两个参数,输入的维度和隐层的维度,这样就可以把权重和偏置的维度确定下来

调用的时候需要传入的参数是输入和隐层,得到隐层。例如输入x0和h0,得到h1

构造数据:

 我们在构造数据的时候,要注意输入的形状是batch*input_size,(因为每次都是处理一个批次的数据),隐层的输入是batch*hidden_size,输出的形状是batch*hidden_size。

RNN:

以循环的形式,把序列放入RNNCell计算隐层的过程,就是RNN

利用torch.nn.RNNCell实现RNN实例:

代码:

import torch
batch_size=1
seq_len=3
input_size=4
hidden_size=2
#创建
cell=torch.nn.RNNCell(input_size=input_size,hidden_size=hidden_size)
#构造数据和隐层
datasets=torch.randn(seq_len,batch_size,input_size)
hidden=torch.zeros(batch_size,hidden_size)
for idx,input in enumerate(datasets):print('='*20,idx,'='*20)print("input size:",input.shape)hidden=cell(input,hidden)#调用函数,输入的形状是batch*input_size,hidden的形状是batch*hidden_sizeprint("output_size",hidden.shape)print(hidden)

利用torch.nn.RNN实现RNN实例:

函数定义时要定义的参数是输入维度、输出维度和层数

函数调用时传入的参数是输入和隐层,out是输出,hidden是最后一个隐层的输出

这个构造数据和RNNCell有所区别,输入的维度是seq_size*batch*input_size(加了一个序列的长度,因为直接使用RNN函数,就不用循环每个序列了,直接把所有序列都输入进去),最开始的hidden为num_layers*batch*hidden_size。得到的out的形状是seq_size*batch*hidden*size,hidden

的形状是num_layers*batch*hidden_size(有几层,就会有几个hidden)

 代码实现:

import torch
batch_size=1
seq_len=3
input_size=4
hidden_size=2
num_layers=2
#函数定义
rnn=torch.nn.RNN(input_size=input_size,hidden_size=hidden_size,num_layers=num_layers)
#数据构建
hidden=torch.zeros(num_layers,batch_size,hidden_size)
input=torch.randn(seq_len,batch_size,input_size)
#函数调用
out,hidden=rnn(input,hidden)
print('output size:',out.shape)
print('output:',out)
print('hidden size:',hidden.shape)
print('hidden:',hidden)

 实现“序列”到“序列”

 RNN的数据必须是向量

 首先根据输入建一个字典,里面包括各出现的单词和索引,然后根据这个字典将input转换为索引的形式,最后创建一个one-hot向量,维度就是出现的单词的总数量。把独热向量作为输入传入模型。

输出的维度也是4,接一个交叉熵代表属于每个类别的概率,然后在来一个max得到索引。例如第一个想要得到的输出是o,那得到的索引值就是3。

利用torch.nn.RNNCell实现

import torch
input_size=4
hidden_size=4
batch_size=1
idx2char=['e','h','l','o']
x_data=[1,0,2,2,3]
y_data=[3,1,2,3,2]
one_hot_lookup=[[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1]]
x_one_hot=[one_hot_lookup[x] for x in x_data]#输入
inputs=torch.Tensor(x_one_hot).view(-1,batch_size,input_size)#首先转换为Tensor,然后view函数调整形状
labels=torch.LongTensor(y_data).view(-1,1)
class Model(torch.nn.Module):def __init__(self,input_size,hidden_size,batch_size):super(Model,self).__init__()self.batch_size=batch_sizeself.input_size=input_sizeself.hidden_size=hidden_size#定义函数,需要的参数是inputsize和hiddensizeself.recell=torch.nn.RNNCell(input_size=self.input_size,hidden_size=self.hidden_size)def forward(self,input,hidden):#函数调用,传入的数据是输入和hidden,输入的形状为batch*input*size,hidden的形状是batch*hidden_sizehidden=self.recell(input,hidden)return hiddendef init_hidden(self):return torch.zeros(self.batch_size,hidden_size)net=Model(input_size,hidden_size,batch_size)
criterion=torch.nn.CrossEntropyLoss()
optimizer=torch.optim.Adam(net.parameters(),lr=0.1)
for epoch in range(15):loss=0optimizer.zero_grad()hidden=net.init_hidden()print('Predicted string:',end='')for input,label in zip(inputs,labels):#输入的形状是1,4;隐层的形状是1,4;标签的形状是1hidden=net(input,hidden)loss+=criterion(hidden,label)_,idx=hidden.max(dim=1)print(idx2char[idx.item()],end='')loss.backward()optimizer.step()print(',epoch[%d/15] loss=%.4f' %(epoch+1,loss.item()))

利用torch.nn.RNN实现

import torch
input_size=4
hidden_size=4
num_layers=1
seq_len=5#5个输入序列
batch_size=1idx2char=['e','h','l','o']
x_data=[1,0,2,2,3]
y_data=[3,1,2,3,2]
one_hot_lookup=[[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1]]
x_one_hot=[one_hot_lookup[x] for x in x_data]
inputs=torch.Tensor(x_one_hot).view(seq_len,batch_size,input_size)
labels=torch.LongTensor(y_data)
class Model(torch.nn.Module):def __init__(self,input_size,hidden_size,batch_size,num_layers=1):super(Model,self).__init__()self.num_layers=num_layersself.batch_size=batch_sizeself.input_size=input_sizeself.hidden_size=hidden_size#定义函数,需要的参数多了一个num_layerself.rnn=torch.nn.RNN(input_size=self.input_size,hidden_size=self.hidden_size,num_layers=num_layers)def forward(self,input):hidden=torch.zeros(self.num_layers,self.batch_size,self.hidden_size)#函数调用,传入的是输入和hidden,输入的维度是seq_len*batch*input_size,hidden的维度是num_layer*batch*hidden_sizeout,_=self.rnn(input,hidden)# 输出的维度是seq_len*batch*hidden_sizereturn out.view(-1,self.hidden_size)net=Model(input_size,hidden_size,batch_size,num_layers)
criterion=torch.nn.CrossEntropyLoss()
optimizer=torch.optim.Adam(net.parameters(),lr=0.1)
for epoch in range(15):optimizer.zero_grad()outputs=net(inputs)loss=criterion(outputs,labels)loss.backward()optimizer.step()_,idx=outputs.max(dim=1)idx=idx.data.numpy()print('Predicted:',''.join([idx2char[x] for x in idx]),end='')print(',Epoch[%d/15] loss=%.4f' %(epoch+1,loss.item()))

3.编码器-解码器”的简单实现

观看了视频:seq2seq的PyTorch实现_哔哩哔哩_bilibili

在RNN中,输入经过编码器会得到out和hidden,在LSTM中,输入经过编码器会得到out,h和c。

out在这里是没有用的,把h和c作为初始参数传入解码器。

例如一开始传入到解码器的输入是\t和h0、c0,然后得到预测输出与新的隐层h1和c1,预测输出与期望输出m计算损失,反向传播更新参数。然后h1、c1和m输入到模型,得到预测结果,预测结果与期望结果a计算损失,反向传播优化参数。

 encoder需要enc_input,decoder需要dec_input和dec_output,需要三个数据

 enc_input先输入到编码器,例如man??E是6个向量,得到一个ht,然后作为解码器初始的隐层,dec_input前面加上一个S表示开始字符,S和ht进到解码器得到预测输出W和下一个隐层,W和期望输出计算损失,然后反向传播优化参数,一直迭代。一直到最后一个字母n输入到解码器,期望得到的输出是E。

代码:
 

# code by Tae Hwan Jung(Jeff Jung) @graykode, modify by wmathor
import torch
import numpy as np
import torch.nn as nn
import torch.utils.data as Datadevice = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
# S: Symbol that shows starting of decoding input
# E: Symbol that shows starting of decoding output
# ?: Symbol that will fill in blank sequence if current batch data size is short than n_stepletter = [c for c in 'SE?abcdefghijklmnopqrstuvwxyz']
letter2idx = {n: i for i, n in enumerate(letter)}seq_data = [['man', 'women'], ['black', 'white'], ['king', 'queen'], ['girl', 'boy'], ['up', 'down'], ['high', 'low']]# Seq2Seq Parameter
n_step = max([max(len(i), len(j)) for i, j in seq_data])  # max_len(=5)
n_hidden = 128
n_class = len(letter2idx)  # classfication problem
batch_size = 3def make_data(seq_data):enc_input_all, dec_input_all, dec_output_all = [], [], []for seq in seq_data:for i in range(2):seq[i] = seq[i] + '?' * (n_step - len(seq[i]))  # 'man??', 'women'enc_input = [letter2idx[n] for n in (seq[0] + 'E')]  # ['m', 'a', 'n', '?', '?', 'E']dec_input = [letter2idx[n] for n in ('S' + seq[1])]  # ['S', 'w', 'o', 'm', 'e', 'n']dec_output = [letter2idx[n] for n in (seq[1] + 'E')]  # ['w', 'o', 'm', 'e', 'n', 'E']enc_input_all.append(np.eye(n_class)[enc_input])dec_input_all.append(np.eye(n_class)[dec_input])dec_output_all.append(dec_output)  # not one-hot# make tensorreturn torch.Tensor(enc_input_all), torch.Tensor(dec_input_all), torch.LongTensor(dec_output_all)'''
enc_input_all: [6, n_step+1 (because of 'E'), n_class]
dec_input_all: [6, n_step+1 (because of 'S'), n_class]
dec_output_all: [6, n_step+1 (because of 'E')]
'''
enc_input_all, dec_input_all, dec_output_all = make_data(seq_data)class TranslateDataSet(Data.Dataset):def __init__(self, enc_input_all, dec_input_all, dec_output_all):self.enc_input_all = enc_input_allself.dec_input_all = dec_input_allself.dec_output_all = dec_output_alldef __len__(self):  # return dataset sizereturn len(self.enc_input_all)def __getitem__(self, idx):return self.enc_input_all[idx], self.dec_input_all[idx], self.dec_output_all[idx]loader = Data.DataLoader(TranslateDataSet(enc_input_all, dec_input_all, dec_output_all), batch_size, True)# Model
class Seq2Seq(nn.Module):def __init__(self):super(Seq2Seq, self).__init__()self.encoder = nn.RNN(input_size=n_class, hidden_size=n_hidden, dropout=0.5)  # encoderself.decoder = nn.RNN(input_size=n_class, hidden_size=n_hidden, dropout=0.5)  # decoderself.fc = nn.Linear(n_hidden, n_class)def forward(self, enc_input, enc_hidden, dec_input):# enc_input(=input_batch): [batch_size, n_step+1, n_class]# dec_inpu(=output_batch): [batch_size, n_step+1, n_class]enc_input = enc_input.transpose(0, 1)  # enc_input: [n_step+1, batch_size, n_class]dec_input = dec_input.transpose(0, 1)  # dec_input: [n_step+1, batch_size, n_class]# h_t : [num_layers(=1) * num_directions(=1), batch_size, n_hidden]_, h_t = self.encoder(enc_input, enc_hidden)# outputs : [n_step+1, batch_size, num_directions(=1) * n_hidden(=128)]outputs, _ = self.decoder(dec_input, h_t)model = self.fc(outputs)  # model : [n_step+1, batch_size, n_class]return modelmodel = Seq2Seq().to(device)
criterion = nn.CrossEntropyLoss().to(device)
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)for epoch in range(5000):for enc_input_batch, dec_input_batch, dec_output_batch in loader:# make hidden shape [num_layers * num_directions, batch_size, n_hidden]h_0 = torch.zeros(1, batch_size, n_hidden).to(device)(enc_input_batch, dec_intput_batch, dec_output_batch) = (enc_input_batch.to(device), dec_input_batch.to(device), dec_output_batch.to(device))# enc_input_batch : [batch_size, n_step+1, n_class]# dec_intput_batch : [batch_size, n_step+1, n_class]# dec_output_batch : [batch_size, n_step+1], not one-hotpred = model(enc_input_batch, h_0, dec_intput_batch)# pred : [n_step+1, batch_size, n_class]pred = pred.transpose(0, 1)  # [batch_size, n_step+1(=6), n_class]loss = 0for i in range(len(dec_output_batch)):# pred[i] : [n_step+1, n_class]# dec_output_batch[i] : [n_step+1]loss += criterion(pred[i], dec_output_batch[i])if (epoch + 1) % 1000 == 0:print('Epoch:', '%04d' % (epoch + 1), 'cost =', '{:.6f}'.format(loss))optimizer.zero_grad()loss.backward()optimizer.step()# Test
def translate(word):enc_input, dec_input, _ = make_data([[word, '?' * n_step]])enc_input, dec_input = enc_input.to(device), dec_input.to(device)# make hidden shape [num_layers * num_directions, batch_size, n_hidden]hidden = torch.zeros(1, 1, n_hidden).to(device)output = model(enc_input, hidden, dec_input)# output : [n_step+1, batch_size, n_class]predict = output.data.max(2, keepdim=True)[1]  # select n_class dimensiondecoded = [letter[i] for i in predict]translated = ''.join(decoded[:decoded.index('E')])return translated.replace('?', '')print('test')
print('man ->', translate('man'))
print('mans ->', translate('mans'))
print('king ->', translate('king'))
print('black ->', translate('black'))
print('up ->', translate('up'))

4.简单总结nn.RNNCell、nn.RNN

总结RNN,从内部实现和函数使用两方面总结

nn.RNNCell内部实现的就是输入的全连接加上隐层的全连接,经过激活得到下一个隐层(也是输出)

 定义函数时需要初始化的参数为输入维度和维度,这样输入的权重和偏置、隐层的权重和偏置都能确定,输入的权重和偏置的维度是input_size*hidden_size,隐层的权重和偏置的维度是hidden_size*hidden_size。

函数调用是需要传入的参数是输入和隐层,输入的维度是batch_size*input_size,隐层的维度是batch_size*hidden_size。所以在定义数据时,要按照这个规则定义。

总结RNN:从内部实现和函数使用两方面总结

RNNCell需要不断循环每个序列,而RNN直接得到所有序列的输出和最后的hidden,其实就是RNNCell的循环

函数定义时,要初始化的参数是输入维度,隐层维度和层数

函数调用时,传入的数据是输入和隐层,输入的维度是seq_len*batch_size*input_size,隐层的维度是num_layers*batch_size*hidden_size,得到的out的维度是seq_len*batch_size*hidden_size,hidden的维度是num_layers*batch_size*hidden_size。

5.谈一谈对“序列”、“序列到序列”的理解

序列通常指的是按时间或某种顺序排列的元素集合,例如天气、股市、自然语言。序列的一个重要特性是元素之间可能存在顺序依赖,顺序的改变可能会导致整个序列的意义发生变化。例如,在语言中,“我喜欢学习”和“学习喜欢我”是两个完全不同的句子,尽管它们的词汇完全相同。

序列到序列(seq2seq)是专门用于处理序列数据的架构,旨在将一个输入序列映射到一个输出序列。Seq2Seq模型的核心思想是“从一个序列到另一个序列”,它的输入和输出都是序列数据。

最经典的结构是编码器+解码器:

编码器(Encoder):编码器的任务是读取输入序列,并将其“编码”成一个固定长度的向量,通常这个向量被称为“上下文向量”或“隐状态”。在传统的Seq2Seq模型中,编码器是一个循环神经网络(RNN),它逐步读取输入序列的每个元素,并更新其内部状态。

解码器(Decoder):解码器负责从编码器输出的上下文向量中生成目标序列。解码器同样是一个RNN,它逐步生成每个目标元素,并使用前一个生成的元素作为输入,直到生成完整的输出序列。

虽然传统的Seq2Seq模型在一些任务中取得了不错的效果,但它也存在一些不足之处。最主要的问题是它使用固定长度的上下文向量来表示整个输入序列,这在长序列时可能导致信息丢失或无法有效表示复杂的依赖关系。

为了解决这个问题,许多改进方法应运而生,例如:

注意力机制(Attention Mechanism):通过让解码器在生成每个输出时关注输入序列的不同部分,注意力机制显著提升了Seq2Seq的性能,尤其在处理长序列时。

Transformer架构:一种基于注意力机制的模型,不再依赖RNN,而是通过自注意力机制(self-attention)捕捉序列中的长距离依赖,大大提高了效率和性能。

6.总结本周理论课和作业,写心得体会

首先利用numpy实现了SNN,输入序列的维度最终变为hidden_size,其实就是一个全连接。RNN和全连接的区别是,每次得到的hidden还要作为下一次的输入。

然后我明白了torch.nn.RNNCell和torch.nn.RNN的内部实现原理,以及函数定义和调用,定义函数时要初始化的参数和调用函数时要传入数据大小都是要记住的。然后分别运用这两个函数实现了一个小例子。

最后我观看了一个seq2seq的例子,并自己编写了一遍。这个模型分为两个模块,一个是编码器,一个是解码器(都是定义的RNN)。在这个模型中需要用到三个数据,分别是enc_input,dec_input,dec_output,首先enc_input输入到编码器得到最后的ht,然后ht作为解码器的初始隐层和dec_input中第一个序列一起传入解码器,得到预测输出和隐层,预测输出和dec_output计算损失,反向传播,以此类推。

老师上课讲了RNN,我当时知道是怎么回事,但是是很朦胧的,经过这个作业,我更加明白了RNN的结构,它只有一个RNNCell,不同的序列在不同的时间传入RNNCell得到hidden。而且RNN处理的是写序列,这个一定要记得,例如序列维度是4,那么全连接层的输入神经元是4个,这个一定要记住!

参考:seq2seq的PyTorch实现_哔哩哔哩_bilibili

12.循环神经网络(基础篇)_哔哩哔哩_bilibili

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com