网站备案期间 搜索引擎,制作网页的流程,wordpress删除相似文章,数据库2008做企业网站以下是RNN的计算公式,t时刻的隐藏状态H(t)等于前一时刻隐藏状态H(t-1)乘以参数矩阵#xff0c;再加t时刻的输入x(t)乘以参数矩阵#xff0c;最后再通过激活函数#xff0c;等到t时刻隐藏状态。 下图是输出input和初始化的隐藏状态#xff0c;当参数batch_first True时候再加t时刻的输入x(t)乘以参数矩阵最后再通过激活函数等到t时刻隐藏状态。 下图是输出input和初始化的隐藏状态当参数batch_first True时候输入是batch_size,Sequence_length,input_size),参数batch_first False的时候输入是 (Sequence_length,batch_size,input_size) h_0就是初始时刻的隐藏状态hidden state,一般情况下输入是(D*num_layers,N,H_out)
D如果是双向RNN则为2如果是单向RNN则为1num_layers: 是RNN的层数NBatch_size 大小H_in input sizeH_out : hidden_size 写到这里也就把RNN的传入参数给将明白了主要就是初始隐藏态和input 输出输出分别输出最后一个时刻的隐藏态以及所有时刻隐藏态的堆叠作为输出outputsoutputs: 当batch_first True时输出为batch_size,Sequence_length,hidden_size * D当batch_first False 的时候输出为(Sequence_length,Batch_size,hidden_size*D)h_n: 输出为(D*num_layers,Batch_size,hidden_size)参数 D 同上面一样这里不在赘述。 示例 RNN 返回值中 outputs 和 hidden_n的关系 由下图可知outputs最后一个时间步的输出就是hidden_n