当前位置: 首页 > news >正文

口碑好网站建设费用有做h的小说网站

口碑好网站建设费用,有做h的小说网站,网站免费高清素材软件有哪些,成都网站建设 erp前言#xff1a; 长短期记忆网络#xff08;LSTM#xff0c;Long Short-Term Memory#xff09;是一种时间循环神经网络#xff0c;是为了解决一般的RNN#xff08;循环神经网络#xff09;存在的长期依赖问题而专门设计出来的。 目录#xff1a; 背景简介 LSTM C…前言 长短期记忆网络LSTMLong Short-Term Memory是一种时间循环神经网络是为了解决一般的RNN循环神经网络存在的长期依赖问题而专门设计出来的。 目录 背景简介     LSTM Cell     LSTM 反向传播算法     为什么能解决梯度消失      LSTM 模型的搭建 一  背景简介 1.1  RNN RNN 忽略 模型可以简化成如下 图中Rnn Cell 可以很清晰看出在隐藏状态。 得到 后: 一方面用于当前层的模型损失计算另一方面用于计算下一层的 由于RNN梯度消失的问题后来通过LSTM 解决  1.2 LSTM 结构 二  LSTM  Cell LSTMCell(RNNCell) 结构 前向传播算法 Forward 2.1   更新 forget gate 忘记门 将值朝0 减少 激活函数一般用sigmoid 输出值[0,1] 2.2 更新 Input gate 输入门 决定是不是忽略输入值 2.3 更新 候选记忆单元 2.4 更新 记忆单元 2.5  更新 输出门 决定是否使用隐藏值 2.6. 隐藏状态 2.7  模型输出 LSTM 门设计的解释一  输入门 遗忘门输出门 不同取值组合的时候记忆单元的输出情况 三  LSTM 反向传播推导 3.1 定义两个 3.2  定义损失函数 损失函数分为两部分:  时刻t的损失函数  时刻t后的损失函数 3.3 最后一个时刻的 这里面要注意这里的 证明一下第二项主要应用到微分的两个性质,以及微分和迹的关系          ... 公式1 微分和迹的关系              因为                           带入上面公式1                        所以 3.4   链式求导过程 求导结果 这里详解一下推导过程   这是一个符合函数求导先把h 写成向量形成  ------------------------------------------------------------     第一项                                            设             则                   其中利用矩阵求导的定义法 分子布局原理                      是一个对角矩阵                                                                         几个连乘起来就是第一项                 第二项 参考     其中     其它也是相似就有了上面的求导结果 四  为什么能解决梯度消失 4.1 RNN 梯度消失的原理 ,复旦大学邱锡鹏书里面 有更加详细的解释通过极大假设 在梯度计算中存在梯度的k 次方连乘 导致 梯度消失原理。 4.2  LSTM 解决梯度消失 解释1 通过上面公式发现梯度计算中是加法运算不存在连乘计算 极大概率降低了梯度消失的现象。 4.3  LSTM 解决梯度 消失解释2 记忆单元c  作用相当于ResNet的残差部分.   比如 时候,,不会存在梯度消失。 五 模型的搭建 我们最后发现 的维度必须一致都是hidden_size 通过,则  最后一个维度也必须是hidden_size # -*- coding: utf-8 -*-Created on Thu Aug 3 15:11:19 2023author: chengxf2 # -*- coding: utf-8 -*-Created on Wed Aug 2 15:34:25 2023author: chengxf2 import torch from torch import nn from d21 import torch as d21def normal(shape,devices):data torch.randn(size shape, devicedevices)*0.01return datadef get_lstm_params(input_size, hidden_size,categorize_size,devices):#隐藏门参数W_xf normal((input_size, hidden_size), devices)W_hf normal((hidden_size, hidden_size),devices)b_f torch.zeros(hidden_size,devices)#输入门参数W_xi normal((input_size, hidden_size), devices)W_hi normal((hidden_size, hidden_size),devices)b_i torch.zeros(hidden_size,devices)#输出门参数W_xo normal((input_size, hidden_size), devices)W_ho normal((hidden_size, hidden_size),devices)b_o torch.zeros(hidden_size,devices)#临时记忆单元W_xc normal((input_size, hidden_size), devices)W_hc normal((hidden_size, hidden_size),devices)b_c torch.zeros(hidden_size,devices)#最终分类结果参数W_hq normal((hidden_size, categorize_size), devices)b_q torch.zeros(categorize_size,devices)params [W_xf,W_hf,b_f,W_xi,W_hi,b_i,W_xo,W_ho,b_o,W_xc,W_hc,b_c,W_hq,b_q]for param in params:param.requires_grad_(True)return paramsdef init_lstm_state(batch_size, hidden_size, devices):cell_init torch.zeros((batch_size, hidden_size),devicedevices)hidden_init torch.zeros((batch_size, hidden_size),devicedevices)return (cell_init, hidden_init)def lstm(inputs, state, params):[W_xf,W_hf,b_f,W_xi,W_hi,b_i,W_xo,W_ho,b_o,W_xc,W_hc,b_c,W_hq,b_q] params (H,C) stateoutputs []for x in inputs:#input gateI torch.sigmoid((xW_xi)(HW_hi)b_i)F torch.sigmoid((xW_xf)(HW_hf)b_f)O torch.sigmoid((xW_xo)(HW_ho)b_o)C_tmp torch.tanh((xW_xc)(HW_hc)b_c)C F*CI*C_tmpH O*torch.tanh(C)Y (HW_hq)b_qoutputs.append(Y)return torch.cat(outputs, dim0),(H,C)def main():batch_size,num_steps 32, 35train_iter, cocab d21.load_data_time_machine(batch_size, num_steps)if __name__ __main__:main() 参考 CSDN https://www.cnblogs.com/pinard/p/6519110.html 57 长短期记忆网络LSTM【动手学深度学习v2】_哔哩哔哩_bilibili
http://www.dnsts.com.cn/news/145775.html

相关文章:

  • 绍兴网站建设冯炳良wordpress加置顶功能
  • 有域名在本机上做网站东莞离莞最新规定
  • 商丘做网站公司新站seo快速收录网站内容页的方法网站美工费用
  • 班级博客网站模板桂林旅游攻略必去景点
  • 公司网站推广技巧建设银行六安市分行网站
  • 网站建设包括哪些方面网站刷流量有用吗
  • 中国的网站建设数据分析网站建设受众
  • 长沙做网站优化的公司四川省城乡建设网站
  • 可拖动网站网站后台关键词
  • 那些行业做网站优化的比较多wordpress 不显示媒体
  • 网站开发流程到上线网站备案是指什么
  • 网上做兼职网站有哪些域名查询138
  • 做个网站需要哪些东西做seo网站 公司
  • asp网站实例html做网页
  • 莱阳 网站建设安居客官网入口
  • wordpress 好的相册上海整站优化公司
  • 图库网站cms来广营网站建设
  • 模板网站建设公司哪个好网站升级公告模板
  • 重庆出名的网站建设公司中国建设人才网络学院登录入口
  • 深圳网站建设 乐云践新工业和信息化部网站备案管理系统
  • 合众商道网站开发帝国网站数据库配置文件
  • 没有有知道钓鱼网站在哪儿做中国最新消息
  • 中国建设银行网站类型etherna 简洁商业企业wordpress
  • 网站站点规划实例中国建设银行官网站基金查询
  • 菏砖网站建设程序员和软件开发的区别
  • 怎么从阿里巴巴做网站品牌网站建设绿d茶
  • 营销策划好的网站seo刷排名软件
  • 查网站域名备案贵州网站建设gzzctyi
  • 帮别人做网站网信办抓好网站建设
  • 北京高端网站开发青岛做网站方案