当前位置: 首页 > news >正文

山西省建设局网站app推广引流

山西省建设局网站,app推广引流,360免费wifi创建失败怎么回事,苏州注册公司网上核名神经网络原理 激活函数 引入非线性#xff1a; 这是最核心、最重要的作用#xff01; 如果没有激活函数#xff08;或者使用线性激活函数f(x) x#xff09;#xff0c;无论神经网络有多少层#xff0c;其整体计算仍然等价于一个单层的线性变换 (y Wx b)。 梯度下降…神经网络原理 激活函数   引入非线性 这是最核心、最重要的作用 如果没有激活函数或者使用线性激活函数f(x) x无论神经网络有多少层其整体计算仍然等价于一个单层的线性变换 (y Wx b)。 梯度下降 找到能使损失函数值最小化的模型参数 初始化 随机选择一个起点给模型参数赋初值。 计算梯度 在当前参数位置计算损失函数关于所有参数的梯度。这个梯度告诉你“哪个方向是当前最陡的上坡”。 沿负梯度方向更新 向负梯度方向迈出一小步更新参数。迈出的步长由学习率控制。 新参数 旧参数 - 学习率 * 梯度 重复 不断重复步骤 2 和 3计算新位置的梯度再次沿负梯度方向更新参数。 核心思想 通过迭代地计算梯度并沿着最陡下降方向负梯度方向调整参数逐步逼近损失函数的最小值点。 学习率的重要性 太大步长过大可能会“跨过”谷底甚至导致损失值震荡或发散在山谷两边来回跳。 太小步长过小收敛速度极慢可能需要非常多的步骤才能到达谷底甚至卡在不是最低点的平坦区域局部极小点或鞍点。 损失函数  均方误差 (MSE) L 1/N * Σ(ŷ_i - y_i)²。最常用于回归问题预测连续值。惩罚大的误差很重。 平均绝对误差 (MAE) L 1/N * Σ|ŷ_i - y_i|。也用于回归。对异常值比MSE更鲁棒不那么敏感。 交叉熵损失 (Cross-Entropy Loss) 这是分类问题尤其是多分类的标准损失函数。 二分类交叉熵 L -[y * log(ŷ) (1 - y) * log(1 - ŷ)] (y是0或1的真实标签ŷ是预测为1的概率)。 多分类交叉熵 L -Σ y_i * log(ŷ_i) (y_i是真实标签的one-hot编码ŷ_i是模型预测的对应类别的概率)。它衡量预测概率分布与真实概率分布one-hot之间的差异。 Hinge Loss (合页损失) 常用于支持向量机(SVM)和某些神经网络分类任务尤其是最大间隔分类。 优化器 它利用损失函数关于模型参数的梯度信息决定如何调整参数以最小化损失函数 你构建一个神经网络结构输入层、隐藏层、输出层定义神经元和连接。 选择一个合适的损失函数来衡量预测的好坏。 选择一个优化器如Adam来指导参数更新的策略。 将一批数据输入网络进行前向传播得到预测。 计算损失。 使用反向传播计算损失函数关于所有权重/偏置参数的梯度。 优化器利用这些梯度按照其特定的更新规则如Adam的动量自适应学习率更新网络参数。 重复步骤4-7。在这个过程中参数沿着损失函数的负梯度方向逐步调整梯度下降思想使得损失不断减小预测越来越准。激活函数则在每一层的神经元内部施加非线性变换赋予网络强大的拟合能力。 from gettext import npgettext from socket import NI_NAMEREQD import torch torch.cuda if torch.cuda.is_available():print(CUDA可用)device_count torch.cuda.device_count()print(fCUDA设备数量: {device_count})curent_devicetorch.cuda.current_device()print(f当前使用的CUDA设备: {curent_device})device_name torch.cuda.get_device_name(curent_device)print(f当前CUDA设备名称: {device_name} ) else:print(CUDA不可用)from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split import numpy as np iris load_iris() X iris.data y iris.target X_train,X_test,y_train,y_test train_test_split(X,y,test_size0.2,random_state42) print(X_train.shape) print(y_train.shape) print(X_test.shape) print(y_test.shape)from sklearn.preprocessing import MinMaxScaler scaler MinMaxScaler() X_train scaler,fit_transform(X_train) X_test scaler.transform(X_test)X_train torch.FloatTensor(X_train) X_test torch.FloatTensor(X_test) y_train torch.LongTensor(y_train) y_test torch.LongTensor(y_test)import torch import torch.nn as nn import torch.optim as optimclass MLP(nn.Module):def __init__(self):super(MLP,self).__init__()self.fc1 nn.Linear(4,10)self.relu nn.ReLU()self.fc2 nn.Linear(10,3)def forward(self,x):out self.fc1(x)out self.relu(out)out self.fc2(out)return out model MLP()criterion nn.CrossEntropyLoss() optimizer optim.SGD(model.parameters(),lr0.01)num_epochs 20000 losses [] for epoch in range(num_epochs):outputs model.forward(X_train)loss criterion(outputs,y_train)optimizer.zero_grad()loss.backward()optimizer.step()losses.append(loss.item())if (epoch1) % 100 0:print(fEpoch [{epoch1}/{num_epochs}], Loss: {loss.item():.4f})import matplotlib.pyplot as plt plt.plot (range{num_epochs},losses) plt.xlabel(Epoch) plt.ylable(Loss) plt.title(Training Loss overe Epochs) plt.show() 浙大疏锦行
http://www.dnsts.com.cn/news/111048.html

相关文章:

  • 怎么更改网站栏目id成都网站建设 Vr功能 卓 公司
  • 岳阳网站设计做网站办公照片
  • 北京轨道交通建设公司网站动态效果的网站建设
  • 直播型网站开发网站后台怎么
  • 建设专业网站的利弊h5网站模板
  • 厦门网站开发比较大的公司女装电子商务网站建设
  • 网站建设方案 前台 后台百度小说排行榜风云榜单
  • 备案 多个网站网页游戏网站源码
  • 开网站平台需要多少钱河北中石化建设网站
  • 西安的网站建设公司电影影视网站模板免费下载
  • 网站发布信息的基本流程电子商务网站建设与维护能赚多少钱
  • 如何注销网站备案号城乡建设部网站广州市
  • 宁波提高网站排名做网站优化要多少钱
  • 建个网站的费用devexpress网站开发
  • 做网站怎么认证微博代理服务器ip国外
  • 医药电子商务网站建设与管理炫富做图网站
  • 便宜做网站的公司影视网站怎么做原创
  • 企业网站接入微信支付网站收录 作用
  • 什么网站做啤酒视频发布网站有哪些内容
  • 重庆网站服务器建设推荐关键词搜索排名工具
  • 宁波网站建设xpckj洒长春菩网站建设
  • 汕头整站优化宁波东方论坛
  • 做网站的软件电子行业网站开发管理软件
  • 代做网站平台电脑如何做网页
  • 网站站点断开数字域名有哪些网站
  • 国外ui界面设计网站物流网站有哪些
  • 制作网站报价单wordpress search everything
  • 网站 备案规定桦南县建设局网站
  • 装修网站建设方案天津信息网
  • 国外建站系统网站版面的图文是怎么做的