当前位置: 首页 > news >正文

重庆便宜做网站的关键词优化软件

重庆便宜做网站的,关键词优化软件,如何网站关键词优化,厦门网站建设制作工具一、seq2seq任务 特点#xff1a;输入输出均为不定长的序列 自回归语言模型#xff1a; 由前面一个字预测下一个字的任务 encoder-decoder结构#xff1a; Encoder-Decoder结构是一种基于神经网络完成seq2seq任务的常用方案 Encoder将输入转化为向量或矩阵#xff0c;其…一、seq2seq任务 特点输入输出均为不定长的序列 自回归语言模型 由前面一个字预测下一个字的任务 encoder-decoder结构 Encoder-Decoder结构是一种基于神经网络完成seq2seq任务的常用方案 Encoder将输入转化为向量或矩阵其中包含了输入中的信息 Decoder利用这些信息输出目标值 在这里encoder的output和decoder每一个时间层的output拼接用一个线性层和softmax激活函数计算权重attention机制再把权重张量和encoder的output点乘把这个结果和decoder这个时间层的output拼接再过一层gru和线性层得到下一个字的概率分布。 attention思想: 从decoder的query和encoder的key结合计算出权重判断文本的重点再作用在value上 soft attention: hard attention: teacher forcing:在预测下一个字时用输入decoder的正确的字来预测这样做的问题是在预测时如果一个字错后面会出现连环反应就像在平时老师经常把正确答案给学生在考试时学生答题效果不好如果用非teacher forcing会出现在训练模型时一个字错导致后面出现连环反应。 二、transformer 在encoder-decoder交互attention阶段q矩阵由decoder提供与encoder的output里的key计算出attention矩阵然后作用在encoder提供的value矩阵上再过残差机制曾和LN层使模型更稳定防止梯度爆炸和梯度消失 mask attention: 将输入decoder的文本做一次attention对输出的矩阵进行mask因为预测的过程中预测下一个字的过程中我们看不到下一个字所以前一个字对下一个字没有attention) 通过mask控制训练方式: 三、采样策略 beamsearch在前文已经介绍过 temperature sample是基于对softmax的改进采样 当T越大时不同样本间的概率差值会减小 top-K采样从概率最高的K个样本中采样 top-P采样采样时先按概率从高到低排序从累加概率不超过P的范围内选择
http://www.dnsts.com.cn/news/944.html

相关文章:

  • 美国人在床上做裸身体网站啊游戏推广赚佣金
  • 网站有了如何做推广宁波网站seo公司
  • 宝鸡商城网站开发市场营销案例分析及解答
  • 我想做个网站怎么做的5000元网站seo推广
  • 专业的佛山网站建设seo优化易下拉霸屏
  • 龙岗网站制作新闻网页怎么制作
  • 网站开发难不难深圳知名网络优化公司
  • 郑州做系统集成的公司网站南京谷歌优化
  • 北京定制公交网站最佳磁力搜索天堂
  • 网站开发提供的服务百度seo公司报价
  • 站长工具端口小说排行榜
  • 建设168网站合肥网站外包
  • 网站排版代码专业的推广公司
  • 济南专业做网站公司百度广告公司联系方式
  • 网站开发人员岗位职责重庆森林讲的什么内容
  • seo 怎么建设网站外链友链申请
  • 讨论致同国际网站建设情况永州网站seo
  • 济南房产信息网seo全网营销公司
  • 做跨境电商网站报价网络营销形式
  • 张家口网站建设深圳整合营销
  • 自己如何制作一个软件重庆seo黄智
  • 网页设计尺寸规范psseo营销培训
  • 公司资质查询官方网站怎么免费制作网页
  • 网站代码怎么改国内网站建设公司
  • 广州哪里做公司网站号网络推广外包要多少钱
  • 做优化网站多少钱东莞做网站seo
  • 昆山品牌设计公司营销型网站建设优化建站
  • 电脑上如何做网站宣传什么是seo优化推广
  • 碑林区营销型网站建设软文营销的技巧
  • 网站标签优化怎么做移动端排名优化软件