当前位置：首页 > news >正文

公司想建网站珠海正规网站制作哪家强

news 2025/11/23 20:01:11

公司想建网站,珠海正规网站制作哪家强,wifi已连接(无法上网),ui设计需要学历吗深度学习——深度学习计算二文章目录前言三、延后初始化四、自定义层4.1. 不带参数的层4.2. 带参数的层五、读写文件5.1. 加载和保存张量5.2. 加载和保存模型参数六、GPU6.1. 计算设备6.2. 张量与GPU6.3. 神经网络与GPU 总结前言延续上一章的学习#xff0c;本章继续记… 深度学习——深度学习计算二文章目录前言三、延后初始化四、自定义层4.1. 不带参数的层4.2. 带参数的层五、读写文件5.1. 加载和保存张量5.2. 加载和保存模型参数六、GPU6.1. 计算设备6.2. 张量与GPU6.3. 神经网络与GPU 总结前言延续上一章的学习本章继续记录深度学习计算的知识点。参考书《动手学深度学习》三、延后初始化框架的延后初始化defers initialization 即直到数据第一次通过模型传递时框架才会动态地推断出每个层的大小在以后当使用卷积神经网络时由于输入维度即图像的分辨率将影响每个后续层的维数有了该技术将更加方便。延后初始化使框架能够自动推断参数形状使修改模型架构变得容易避免了一些常见的错误。我们可以通过模型传递数据使框架最终初始化参数。当我们实例化一个多层感知机时一旦我们知道输入维数是20框架可以通过代入值20来识别第一层权重矩阵的形状。识别出第一层的形状后框架处理第二层依此类推直到所有形状都已知为止。注意在这种情况下只有第一层需要延迟初始化但是框架仍是按顺序初始化的。等到知道了所有的参数形状框架就可以初始化参数。四、自定义层深度学习成功背后的一个因素是神经网络的灵活性我们可以用创造性的方式组合不同的层从而设计出适用于各种任务的架构。有时我们会遇到或要自己发明一个现在在深度学习框架中还不存在的层。在这些情况下必须构建自定义层。 4.1. 不带参数的层首先我们构造一个没有任何参数的自定义层。要构建它我们只需继承基础层类并实现前向传播功能。 #下面的CenteredLayer类要从其输入中减去均值。要构建它我们只需继承基础层类并实现前向传播功能。 import torch from torch import nn import torch.nn.functional as Fclass Centerdlayer(nn.Module):def __init__(self):super().__init__()def forward(self,x):return x-x.mean()layer Centerdlayer() print(layer(torch.FloatTensor([1,2,3,4,5])))#现在我们可以将层作为组件合并到更复杂的模型中 net nn.Sequential(nn.Linear(8,128),Centerdlayer())#作为额外的健全性检查我们可以在向该网络发送随机数据后检查均值是否为0。 #由于我们处理的是浮点数因为存储精度的原因我们仍然可能会看到一个非常小的非零数。 y net(torch.rand(4,8)) print(y.mean())#结果 tensor([-2., -1., 0., 1., 2.]) tensor(-5.1223e-09, grad_fnMeanBackward0) 4.2. 带参数的层让我们实现自定义版本的全连接层。该层需要两个参数一个用于表示权重另一个用于表示偏置项。在此实现中我们使用修正线性单元作为激活函数。该层需要输入参数in_units和units分别表示输入数和输出数。 class Mylinear(nn.Module):def __init__(self,in_units,units):super().__init__()self.weight nn.Parameter(torch.randn(in_units,units))self.bias nn.Parameter(torch.randn(units,))def forward(self,x):linear torch.matmul(x,self.weight.data) self.bias.datareturn F.relu(linear)linear Mylinear(5,3) print(linear.weight)#我们可以[使用自定义层直接执行前向传播计算]。 print(linear(torch.rand(2,5)))#我们还可以(使用自定义层构建模型)就像使用内置的全连接层一样使用自定义层 net nn.Sequential(Mylinear(64,8),Mylinear(8,1)) print(net(torch.rand(2,64)))#结果 Parameter containing: tensor([[ 0.6645, -1.0066, -0.3903],[ 1.7685, 1.4849, 0.2311],[-0.1649, -0.9360, -0.5300],[ 1.1137, 1.1452, -1.5475],[ 0.4353, -0.8462, 0.3522]], requires_gradTrue) tensor([[2.6093, 0.0000, 0.3777],[2.6460, 0.0000, 0.0000]]) tensor([[0.0000],[0.4022]]) 五、读写文件 5.1. 加载和保存张量对于单个张量我们可以直接调用load和save函数分别读写它们。这两个函数都要求我们提供一个名称save要求将要保存的变量作为输入。 #加载和保存张量x torch.arange(1,4) print(x) torch.save(x,x-file) #将存储在文件中的数据读回内存 x2 torch.load(x-file) print(x2) #可以存储一个张量列表再读回内存 y torch.zeros_like(x) torch.save([x,y],x-files) x2,y2 torch.load(x-files) print(x2,y2)#也可以读取或写入从字符串映射到张量的字典 mydict {x:x,y:y} torch.save(mydict,mydict) mydict2 torch.load(mydict) print(mydict2) print(mydict2[x])#结果: tensor([1, 2, 3]) tensor([1, 2, 3]) tensor([1, 2, 3]) tensor([0, 0, 0]) {x: tensor([1, 2, 3]), y: tensor([0, 0, 0])} tensor([1, 2, 3]) 5.2. 加载和保存模型参数需要注意的一个重要细节是这将保存模型的参数而不是保存整个模型。例如如果我们有一个3层多层感知机我们需要单独指定架构。因为模型本身可以包含任意代码所以模型本身难以序列化。因此为了恢复模型我们需要用代码生成架构然后从磁盘加载参数。 class MLP(nn.Module):def __init__(self):super().__init__()self.hidden nn.Linear(20,256)self.output nn.Linear(256,10)def forward(self,x):return self.output(F.relu(self.hidden(x)))net MLP() x torch.randn(size (2,20)) y net(x) #将模型的参数存储在文件中 torch.save(net.state_dict(),mlp.params) #实例化了原始多层感知机模型的一个备份 clone MLP() clone.load_state_dict(torch.load(mlp.params)) print(clone.eval()) # eval()的主要作用是将字符串作为Python代码进行解析和执行#由于两个实例具有相同的模型参数在输入相同的X时两个实例的计算结果应该相同。让我们来验证一下。 y_clone clone(x) print(y_clone y)#结果 MLP((hidden): Linear(in_features20, out_features256, biasTrue)(output): Linear(in_features256, out_features10, biasTrue) ) tensor([[True, True, True, True, True, True, True, True, True, True],[True, True, True, True, True, True, True, True, True, True]]) 六、GPU 6.1. 计算设备在PyTorch中CPU和GPU可以用torch.device(‘cpu’) 和torch.device(‘cuda’)表示。如果有多个GPU我们使用torch.device(f’cuda:{i}) 来表示第块GPU 从0开始。另外cuda:0和cuda是等价的。 import torch from torch import nnprint(torch.device(cpu), torch.device(cuda), torch.device(cuda:1))#查询可用gpu的数量 print(torch.cuda.device_count())#这两个函数允许我们在不存在所需所有GPU的情况下运行代码 def try_gpu(i0): #save如果存在则返回gpu(i)否则返回cpu()if torch.cuda.device_count() i 1:return torch.device(fcuda:{i})return torch.device(cpu)def try_all_gpus(): #save返回所有可用的GPU如果没有GPU则返回[cpu(),]devices [torch.device(fcuda:{i})for i in range(torch.cuda.device_count())]return devices if devices else [torch.device(cpu)] 6.2. 张量与GPU 查询张量所在的设备。默认情况下张量是在CPU上创建的。 x torch.tensor([1, 2, 3]) print(x.device)我们可以在创建张量时指定存储设备,一般来说我们需要确保不创建超过GPU显存限制的数据 X torch.ones(2, 3, devicetry_gpu()) print(X)深度学习框架要求计算的所有输入数据都在同一设备上无论是CPU还是GPU 6.3. 神经网络与GPU 类似地神经网络模型可以指定设备。下面的代码将模型参数放在GPU上 net nn.Sequential(nn.Linear(3, 1)) net net.to(devicetry_gpu())#当输入为GPU上的张量时模型将在同一GPU上计算结果 print(net(X)) print(net[0].weight.data.device) 总结本章简单记录了一下深度学习计算中要注意的一些问题延后初始化概念对层的自定义对模型或参数的加载和保存利用GPU进行计算等。果而勿矜果而勿伐果而勿骄果而不得已果而勿强。 –2023-10-6 进阶篇

查看全文

http://www.dnsts.com.cn/news/7229.html