当前位置: 首页 > news >正文

江门模板建站哪家好罗湖网站建设 信科网络

江门模板建站哪家好,罗湖网站建设 信科网络,wordpress发文章下载,WordPress动漫源码这是我的第351篇原创文章。 一、引言 LSTM在1990年代被提出#xff0c;用以解决循环神经网络#xff08;RNN#xff09;的梯度消失问题。LSTM在多种领域取得了成功#xff0c;但随着Transformer技术的出现#xff0c;其地位受到了挑战。如果将LSTM扩展到数十亿参数#…这是我的第351篇原创文章。 一、引言 LSTM在1990年代被提出用以解决循环神经网络RNN的梯度消失问题。LSTM在多种领域取得了成功但随着Transformer技术的出现其地位受到了挑战。如果将LSTM扩展到数十亿参数并利用现代大型语言模型LLM的技术同时克服LSTM的已知限制我们能在语言建模上走多远 论文介绍了两种新的LSTM变体sLSTM具有标量记忆和更新和mLSTM具有矩阵记忆和协方差更新规则并将它们集成到残差块中形成xLSTM架构。 sLSTM引入了指数门控和新的存储混合技术允许LSTM修订其存储决策。 mLSTM将LSTM的记忆单元从标量扩展到矩阵提高了存储容量并引入了协方差更新规则使得mLSTM可以完全并行化。 xLSTM架构通过将sLSTM和mLSTM集成到残差块中构建了xLSTM架构。 二、实现过程 2.1 加载数据 data pd.read_csv(data.csv, usecols[1], enginepython) dataset data.values.astype(float32) 2.2 归一化处理 scaler MinMaxScaler(feature_range(0, 1)) dataset scaler.fit_transform(dataset) 2.3 划分数据集 train_size int(len(dataset) * 0.67) test_size len(dataset) - train_size train, test  dataset[0:train_size, :], dataset[train_size:len(dataset), :]trainX, trainY create_dataset(train, seq_len) testX, testY create_dataset(test, seq_len)# Create data loaders train_dataset TensorDataset(trainX, trainY) test_dataset TensorDataset(testX, testY)train_loader DataLoader(train_dataset, batch_sizebatch_size, shuffleTrue) test_loader DataLoader(test_dataset, batch_sizebatch_size, shuffleFalse) 2.4 构建模型 models {xLSTM: xLSTM(input_size, head_size, num_heads, batch_firstTrue, layersmsm),LSTM: nn.LSTM(input_size, head_size, batch_firstTrue, proj_sizeinput_size),sLSTM: sLSTM(input_size, head_size, num_heads, batch_firstTrue),mLSTM: mLSTM(input_size, head_size, num_heads, batch_firstTrue) } 2.5 训练模型 定义训练函数 def train_model(model, model_name, epochs20, learning_rate0.01):criterion nn.MSELoss()optimizer torch.optim.Adam(model.parameters(), lrlearning_rate)train_losses []for epoch in tqdm(range(epochs), descfTraining {model_name}):model.train()epoch_loss 0for i, (inputs, targets) in enumerate(train_loader):optimizer.zero_grad()outputs, _ model(inputs)outputs outputs[:, -1, :]loss criterion(outputs, targets)loss.backward()optimizer.step()epoch_loss loss.item()train_losses.append(epoch_loss / len(train_loader))plt.plot(train_losses, labelmodel_name)plt.title(fTraining Loss for {model_name})plt.xlabel(Epochs)plt.ylabel(MSE Loss)plt.legend()plt.show()return model, train_losses 开始训练 trained_models  {} all_train_losses {} for model_name, model in models.items():trained_models[model_name], all_train_losses[model_name] train_model(model, model_name) 绘制所有模型的损失函数曲线 plt.figure() for model_name, train_losses in all_train_losses.items():plt.plot(train_losses, labelmodel_name)# Plot all model losses compared plt.title(Training Losses for all Models) plt.xlabel(Epochs) plt.ylabel(MSE Loss) plt.legend() plt.show() 2.6 预测评估 预测 def evaluate_model(model, data_loader):model.eval()predictions []with torch.no_grad():for inputs, _ in data_loader:outputs, _ model(inputs)predictions.extend(outputs[:, -1, :].numpy())return predictionstest_predictions {} for model_name, model in trained_models.items():test_predictions[model_name] evaluate_model(model, test_loader) 预测结果可视化 # Plot predictions for each model for model_name, preds in test_predictions.items():# Inverse transform the predictions and actual valuespreds scaler.inverse_transform(np.array(preds).reshape(-1, 1))actual scaler.inverse_transform(testY.numpy().reshape(-1, 1))plt.figure()plt.plot(actual, labelActual)plt.plot(preds, labelmodel_name Predictions)plt.title(f{model_name} Predictions vs Actual)plt.legend()plt.show()# Plot all model predictions compared plt.figure() plt.plot(actual, labelActual) for model_name, preds in test_predictions.items():# Inverse transform the predictionspreds scaler.inverse_transform(np.array(preds).reshape(-1, 1))plt.plot(preds, labelmodel_name Predictions)plt.title(All Models Predictions vs Actual) plt.legend() plt.show() 结果 作者简介 读研期间发表6篇SCI数据挖掘相关论文现在某研究院从事数据算法相关科研工作结合自身科研实践经历不定期分享关于Python、机器学习、深度学习、人工智能系列基础知识与应用案例。致力于只做原创以最简单的方式理解和学习关注我一起交流成长。需要数据集和源码的小伙伴可以关注底部公众号添加作者微信。​​​​​​​
http://www.dnsts.com.cn/news/269372.html

相关文章:

  • ui设计就业方向有哪些?保定网站建设优化
  • 建设网站哪好怎么建设
  • 绥化建设网站有哪些档案网站
  • 北京建设网站的公司wordpress的标签是什么
  • 如何给网站配色宁波比较好的外贸公司
  • 商城网站建设的优点网站推广营销的意义
  • 贵州省冶金建设有限公司网站北京网页设计公司哪儿济南兴田德润简介
  • 九江建设局网站企业网站建设大概费用
  • 网站建设及维护费用苏州建设建设信息网站
  • 打开百度自动app优化下载
  • 网站建设和技术服务合同企业网站东莞网站建设制作
  • 购物节优惠卷网站怎么做中国建设银行企业信息门户网站
  • 空包网网站怎么做的wordpress xml文件分割器
  • 学生作业 制作一个网站西峡微网站开发
  • 一鸿建设设计网站中信建设有限责任公司盐城高铁城
  • 建设公司网站的会计分录安阳做网站
  • 咸宁网站定制发展速度迅猛 具有丰富的网站建设经验
  • 做网站图片wordpress标题转英文
  • 怎么查询网站的备案号ps教程自学网
  • 宁波高质量品牌网站设计厂家昆山网站建设第一品牌
  • 青岛网站设计哪家便宜非响应式网站优点
  • 贵阳有做网站的公司吗wordpress网站图片
  • 企业网站建设的基本原则为黄骅港赶海时间表
  • 莫名接到网站建设电话网站做接口排线方法
  • 做电影下载网站需要什么软件国内网站建设哪家好
  • 高端网站建设机构网站由哪些部分组成部分
  • 找人做网站如何担保创意设计图案
  • 台州网站优化wordpress search sql
  • t型网站域名和版面驻马店网站开发
  • 网站建设合同模板91075如何将自己做的网站推广出去