当前位置: 首页 > news >正文

织梦网站文章内容模板资料代做网站

织梦网站文章内容模板,资料代做网站,网站开发那个好,网站跳出率 报告摘要 本文讲解如何实现VGGNet的剪枝操作。剪枝的原理#xff1a;在BN层网络中加入稀疏因子#xff0c;训练使得BN层稀疏化#xff0c;对稀疏训练的后的模型中所有BN层权重进行统计排序#xff0c;获取指定保留BN层数量即取得排序后权重阈值thres。遍历模型中的BN层权重在BN层网络中加入稀疏因子训练使得BN层稀疏化对稀疏训练的后的模型中所有BN层权重进行统计排序获取指定保留BN层数量即取得排序后权重阈值thres。遍历模型中的BN层权重制作各层mask权重thres值为1权重thres值为0。剪枝操作根据各层的mask构建新模型结构各层保留的通道数获取BN层权重mask非零值的索引非零索引对应的原始conv层、BN层、linear层各通道的权重、偏置等值赋值给新模型各层。加载剪枝后模型进行fine-tune。 通过本文你可以学到 1、如何使用VGGNet训练模型。 2、如何使用VGGNet稀疏训练模型。 3、如何实现剪枝已及保存剪枝模型和使用剪枝模型预测等操作。 4、如何微调剪枝模型。 剪枝流程分为 第一步、使用VGGNet训练模型。保存训练结果方便将来的比对 第二步、在BN层网络中加入稀疏因子训练模型。 第三步、剪枝操作。 第四步、fine-tune模型提高模型的ACC。 接下来我们一起实现对VGGNet的剪枝。 项目结构 Slimming_Demo├─checkpoints│ ├─vgg│ ├─vgg_pruned│ └─vgg_sp├─data│ ├─train│ │ ├─Black-grass│ │ ├─Charlock│ │ ├─Cleavers│ │ ├─Common Chickweed│ │ ├─Common wheat│ │ ├─Fat Hen│ │ ├─Loose Silky-bent│ │ ├─Maize│ │ ├─Scentless Mayweed│ │ ├─Shepherds Purse│ │ ├─Small-flowered Cranesbill│ │ └─Sugar beet│ └─val│ ├─Black-grass│ ├─Charlock│ ├─Cleavers│ ├─Common Chickweed│ ├─Common wheat│ ├─Fat Hen│ ├─Loose Silky-bent│ ├─Maize│ ├─Scentless Mayweed│ └─Shepherds Purse├─vgg.py├─train.py├─train_sp.py├─prune.py└─train_prune.pytrain.py训练脚本训练VGGNet原始模型 vgg.py模型脚本 train_sp.py稀疏训练脚本。 prune.py模型剪枝脚本。 train_prune.py微调模型脚本。 测试结果 模型大小ACCVGG模型67.4M95.6%VGG裁剪模型3.58M95% VGGNet模型 VGGNet在原有的基础做了修改增加了模型的cfg定义了每层卷积的channel“M”代表池化。 import torch import torch.nn as nn from torch.autograd import Variable import math # initclass VGG(nn.Module):def __init__(self, num_classes, init_weightsTrue, cfgNone):super(VGG, self).__init__()if cfg is None:cfg [64, 64, M, 128, 128, M, 256, 256, 256, 256, M, 512, 512, 512, 512, M, 512, 512, 512, M]self.feature self.make_layers(cfg, True)print(self.feature)self.classifier nn.Linear(cfg[-2], num_classes)if init_weights:self._initialize_weights()def make_layers(self, cfg, batch_normFalse):layers []in_channels 3for v in cfg:if v M:layers [nn.MaxPool2d(kernel_size2, stride2)]else:conv2d nn.Conv2d(in_channels, v, kernel_size3, padding1, biasFalse)if batch_norm:layers [conv2d, nn.BatchNorm2d(v), nn.LeakyReLU(inplaceTrue)]else:layers [conv2d, nn.LeakyReLU(inplaceTrue)]in_channels vreturn nn.Sequential(*layers)def forward(self, x):x self.feature(x)x nn.AdaptiveAvgPool2d(1)(x)x x.view(x.size(0), -1)y self.classifier(x)return ydef _initialize_weights(self):for m in self.modules():if isinstance(m, nn.Conv2d):n m.kernel_size[0] * m.kernel_size[1] * m.out_channelsm.weight.data.normal_(0, math.sqrt(2. / n))if m.bias is not None:m.bias.data.zero_()elif isinstance(m, nn.BatchNorm2d):m.weight.data.fill_(0.5)m.bias.data.zero_()elif isinstance(m, nn.Linear):m.weight.data.normal_(0, 0.01)m.bias.data.zero_()if __name__ __main__:net VGG(12)print(net)x Variable(torch.FloatTensor(1, 3, 224, 224))y net(x)print(y.data.shape)需要安装的库 1、tim库 pip install timm 2、sklearn pip install -U scikit-learn3、tensorboard pip install tensorboard训练VGGNet 新建train.py脚本。接下来详解train.py脚本中的代码。 导入项目所需要的库 import torch.optim as optim import torch import torch.nn as nn import torch.nn.parallel import torch.optim import torch.utils.data import torch.utils.data.distributed import torchvision.transforms as transforms from sklearn.metrics import classification_report from vgg import VGG import os from torchvision import datasets import json import matplotlib.pyplot as plt from timm.data.mixup import Mixup from timm.loss import SoftTargetCrossEntropy import warnings from torch.utils.tensorboard import SummaryWriter warnings.filterwarnings(ignore)设置随机因子 设置随机因子后再次训练时图像的加载顺序不会改变能够更好的复现训练结果。代码如下 def seed_everything(seed42):os.environ[PYHTONHASHSEED] str(seed)torch.manual_seed(seed)torch.cuda.manual_seed(seed)torch.backends.cudnn.deterministic TrueBN层可视化 使用tensorboard 可视化BN的状态方便对比 writer SummaryWriter(commentvgg)def showBN(model):# show bn weights #module_list []module_bias_list []for i, layer in model.named_modules():if isinstance(layer, nn.BatchNorm2d) :bnw layer.state_dict()[weight]bnb layer.state_dict()[bias]module_list.append(bnw)module_bias_list.append(bnb)size_list [idx.data.shape[0] for idx in module_list]bn_weights torch.zeros(sum(size_list))bnb_weights torch.zeros(sum(size_list))index 0for idx, size in enumerate(size_list):bn_weights[index:(index size)] module_list[idx].data.abs().clone()bnb_weights[index:(index size)] module_bias_list[idx].data.abs().clone()index sizeprint(bn_weights:, torch.sort(bn_weights))print(bn_bias:, torch.sort(bnb_weights))writer.add_histogram(bn_weights/hist, bn_weights.numpy(), epoch, binsdoane)writer.add_histogram(bn_bias/hist, bnb_weights.numpy(), epoch, binsdoane)定义全局参数 全局参数包括学习率、批大小、轮数、类别数量等一些模型用到的超参数。 if __name__ __main__:# 创建保存模型的文件夹file_dir checkpoints/vggif os.path.exists(file_dir):print(true)os.makedirs(file_dir, exist_okTrue)else:os.makedirs(file_dir)# 设置全局参数model_lr 1e-4BATCH_SIZE 16EPOCHS 300DEVICE torch.device(cuda:0 if torch.cuda.is_available() else cpu)classes 12resume NoneBest_ACC 0 # 记录最高得分SEED 42seed_everything(42)start_epoch 1数据增强 t [transforms.CenterCrop((224, 224)), transforms.GaussianBlur(kernel_size(5, 5), sigma(0.1, 3.0)),transforms.ColorJitter(brightness0.5, contrast0.5, saturation0.5)]# 数据预处理7transform transforms.Compose([transforms.AutoAugment(),transforms.Resize((224, 224)),transforms.ToTensor(),transforms.Normalize(mean[0.48214436, 0.42969334, 0.33318862], std[0.2642221, 0.23746745, 0.21696019])])transform_test transforms.Compose([transforms.Resize((224, 224)),transforms.ToTensor(),transforms.Normalize(mean[0.48214436, 0.42969334, 0.33318862], std[0.2642221, 0.23746745, 0.21696019])])mixup_fn Mixup(mixup_alpha0.8, cutmix_alpha1.0, cutmix_minmaxNone,prob0.1, switch_prob0.5, modebatch,label_smoothing0.1, num_classesclasses) 增强选用了AutoAugment自动增强默认是ImageNet的增强。在实际的项目中需要选用适合的方式来增强图像数据。过多增强或带来负面的影响。 声明MIxUp函数Mix是一种非常有效的增强方法。加入之后不仅可以提高ACC对泛化性也有很大的提高。 这里注意下Resize的大小由于选用的ResNet模型输入是224×224的大小所以要Resize为224×224。 加载数据 # 读取数据dataset_train datasets.ImageFolder(data/train, transformtransform)dataset_test datasets.ImageFolder(data/val, transformtransform_test)with open(class.txt, w,encodingutf-8) as file:file.write(str(dataset_train.class_to_idx))with open(class.json, w, encodingutf-8) as file:file.write(json.dumps(dataset_train.class_to_idx))# 导入数据train_loader torch.utils.data.DataLoader(dataset_train, batch_sizeBATCH_SIZE, pin_memoryTrue, shuffleTrue,drop_lastTrue)test_loader torch.utils.data.DataLoader(dataset_test, batch_sizeBATCH_SIZE, pin_memoryTrue, shuffleFalse) 加载训练集和验证集的数据并将class_to_idx保存。然后分别声明训练和验证的DataLoader。 定义Loss 多类别分类的loss一般使用交叉熵。代码如下 # 实例化模型并且移动到GPUcriterion_train SoftTargetCrossEntropy().cuda()criterion_val torch.nn.CrossEntropyLoss().cuda()SoftTargetCrossEntropy成为软交叉熵当Label做了平滑之后使用SoftTargetCrossEntropy。 定义模型、优化器以及学习率调整策略 # 设置模型model_ft VGG(classes,True)if resume:model torch.load(resume)model_ft.load_state_dict(model[state_dict])Best_ACC model[Best_ACC]start_epoch model[epoch] 1model_ft.to(DEVICE)print(model_ft)# 选择简单暴力的Adam优化器学习率调低optimizer optim.AdamW(model_ft.parameters(), lrmodel_lr)cosine_schedule optim.lr_scheduler.CosineAnnealingLR(optimizeroptimizer, T_max20, eta_min1e-6)模型就选用前面定义的VGG模型。 优化器选用AdamW。 学习率调整策略选用CosineAnnealingLR。 训练函数 # 定义训练过程 def train(model, device, train_loader, optimizer, epoch, criterion,epochs):model.train()sum_loss 0correct 0total_num len(train_loader.dataset)print(total_num, len(train_loader))for batch_idx, (data, target) in enumerate(train_loader):data, target data.to(device, non_blockingTrue), target.to(device, non_blockingTrue)samples, targets mixup_fn(data, target)output model(samples)loss criterion(output, targets)optimizer.zero_grad()loss.backward()optimizer.step()print_loss loss.data.item()_, pred torch.max(output.data, 1)correct torch.sum(pred target)sum_loss print_lossif (batch_idx 1) % 10 0:print(Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}.format(epoch, (batch_idx 1) * len(data), len(train_loader.dataset),100. * (batch_idx 1) / len(train_loader), loss.item()))ave_loss sum_loss / len(train_loader)correct correct.data.item()acc correct / total_numprint(epoch:{},loss:{}.format(epoch, ave_loss))return ave_loss, acc训练的主要步骤 1、 model.train()切换成训练模型。启用 BatchNormalization 和 Dropout。初始化sum_loss 为0计算训练集图片的数量赋给total_num。correct设置为0 2、进入循环将data和target放入device上non_blocking设置为True。如果pin_memoryTrue的话将数据放入GPU的时候也应该把non_blocking打开这样就只把数据放入GPU而不取出访问时间会大大减少。 如果pin_memoryFalse时则将non_blocking设置为False。 3、samples, targets mixup_fn(data, target)使用mixup_fn方式计算Mixup后的图像数据和标签数据。然后将Mixup后的图像数据samples输入model输出预测结果然后再计算loss。 4、 optimizer.zero_grad() 梯度清零把loss关于weight的导数变成0。 5、反向传播求梯度。 6、获取loss并赋值给print_loss 。 7、torch.sum(pred target)计算当前Batch内预测正确的数量然后累加到correct 。 8、sum_loss 累加print_loss 求得总的loss。所以单个epoch的loss就是总的sum_loss 除以train_loader的长度。 等待一个epoch训练完成后计算平均loss。然后将其打印出来。并返回loss和acc。 验证函数 验证过程增加了对预测数据和Label数据的保存所以需要定义两个list保存然后将其返回 # 验证过程 def val(model, device, test_loader,criterion):model.eval()test_loss 0correct 0total_num len(test_loader.dataset)print(total_num, len(test_loader))val_list []pred_list []with torch.no_grad():for data, target in test_loader:data, target data.to(device, non_blockingTrue), target.to(device, non_blockingTrue)for t in target:val_list.append(t.data.item())output model(data)loss criterion(output, target)_, pred torch.max(output.data, 1)for p in pred:pred_list.append(p.data.item())correct torch.sum(pred target)print_loss loss.data.item()test_loss print_losscorrect correct.data.item()acc correct / total_numavgloss test_loss / len(test_loader)print(\nVal set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n.format(avgloss, correct, len(test_loader.dataset), 100 * acc))return val_list, pred_list, avgloss, acc 验证的过程和训练的过程大致相似主要步骤 1、model.eval()切换验证模型不启用 BatchNormalization 和 Dropout。 2、定义参数: test_loss : 测试的loss correct 统计正确类别的数量。 total_num验证集图片的总数。 val_list 保存验证集的Label数据。 pred_list 保存预测的Label数据。 3、torch.no_grad()反向传播时就不会自动求导了。 4、进入循环迭代test_loader 将label保存到val_list。 将data和target放入device上non_blocking设置为True。 遍历target,将Label保存到val_list 。 将data输入到model中求出预测值然后输入到loss函数中求出loss。在验证集中不用求辅助分类器的loss。 调用torch.max函数将预测值转为对应的label。 遍历pred将预测的Label保存到pred_list。 correct torch.sum(pred target)计算出识别对的数量并累加到correct 变量上。 5、acc correct / total_num计算出acc。 avgloss test_loss / len(test_loader)计算loss。 最后返回val_list, pred_list,loss,acc 训练、验证、保存模型 # 训练log_dir {}train_loss_list, val_loss_list, train_acc_list, val_acc_list, epoch_list [], [], [], [], []if resume and os.path.isfile(result.json):with open(result.json, r, encodingutf-8) as file:logs json.load(file)train_acc_list logs[train_acc]train_loss_list logs[train_loss]val_acc_list logs[val_acc]val_loss_list logs[val_loss]epoch_list logs[epoch_list]for epoch in range(start_epoch, EPOCHS 1):epoch_list.append(epoch)log_dir[epoch_list] epoch_listtrain_loss, train_acc train(model_ft, DEVICE, train_loader, optimizer, epoch, criterion_train,epochsEPOCHS)showBN(model_ft)train_loss_list.append(train_loss)train_acc_list.append(train_acc)log_dir[train_acc] train_acc_listlog_dir[train_loss] train_loss_listval_list, pred_list, val_loss, val_acc val(model_ft, DEVICE, test_loader, criterion_val)print(classification_report(val_list, pred_list, target_namesdataset_train.class_to_idx))val_loss_list.append(val_loss)val_acc_list.append(val_acc)log_dir[val_acc] val_acc_listlog_dir[val_loss] val_loss_listlog_dir[best_acc] Best_ACCwith open(result.json, w, encodingutf-8) as file:file.write(json.dumps(log_dir))if val_acc Best_ACC:Best_ACC val_acctorch.save(model_ft, file_dir / best.pth)state {epoch: epoch,state_dict: model_ft.state_dict(),Best_ACC: Best_ACC}torch.save(state, file_dir / model_ str(epoch) _ str(round(val_acc, 3)) .pth)cosine_schedule.step()fig plt.figure(1)plt.plot(epoch_list, train_loss_list, r-, labeluTrain Loss)# 显示图例plt.plot(epoch_list, val_loss_list, b-, labeluVal Loss)plt.legend([Train Loss, Val Loss], locupper right)plt.xlabel(uepoch)plt.ylabel(uloss)plt.title(Model Loss )plt.savefig(file_dir /loss.png)plt.close(1)fig2 plt.figure(2)plt.plot(epoch_list, train_acc_list, r-, labeluTrain Acc)plt.plot(epoch_list, val_acc_list, b-, labeluVal Acc)plt.legend([Train Acc, Val Acc], loclower right)plt.title(Model Acc)plt.ylabel(acc)plt.xlabel(epoch)plt.savefig(file_dir /acc.png)plt.close(2)思路 定义记录log的字典声明loss和acc的list。如果是接着上次的断点继续训练则读取log文件然后把log取出来赋值到对应的list上。 循环调用train函数和val函数train函数返回train_loss, train_accval函数返回val_list, pred_list, val_loss, val_acc。loss和acc用于绘制曲线。 记录BN的权重状态。 将log字典保存到json文件中。 将val_list, pred_list和dataset_train.class_to_idx传入模型计算模型指标。 判断acc是否大于Best_ACC如果大于则保存模型这里保存的是整个模型。 接下来是保存每个epoch的模型新建state 字典的参数- epoch当前的epoch。- state_dict权重参数。 model_ft.state_dict()只保存模型的权重参数。- Best_ACCBest_ACC的数值。然后调用 torch.save保存模型。cosine_schedule.step()执行学习率调整算法。最后使用plt.plot绘制loss和acc曲线图然后点击train.py运行脚本。 测试结果 最好的模型ACC是95.6%。 稀疏训练VGGNet 微调结果 Val set: Average loss: 0.2845, Accuracy: 457/482 (95%)precision recall f1-score supportBlack-grass 0.79 0.86 0.83 36Charlock 1.00 1.00 1.00 42Cleavers 1.00 0.96 0.98 50Common Chickweed 0.94 0.91 0.93 34Common wheat 0.93 1.00 0.97 42Fat Hen 0.97 0.97 0.97 34Loose Silky-bent 0.88 0.78 0.83 46Maize 0.96 1.00 0.98 45Scentless Mayweed 0.93 0.96 0.95 45Shepherds Purse 0.97 0.97 0.97 35 Small-flowered Cranesbill 1.00 0.97 0.99 36Sugar beet 1.00 1.00 1.00 37accuracy 0.95 482macro avg 0.95 0.95 0.95 482weighted avg 0.95 0.95 0.95 482
http://www.dnsts.com.cn/news/182680.html

相关文章:

  • 延吉市网站建设双语企业网站源码
  • 横向拖动的网站在线设计培训
  • 云服务器可以做两个网站吗正规的金融行业网站开发
  • 网站单页郑州百姓网招聘
  • 做网站如何接单子买国外的东西在哪个平台
  • 深圳seo优化外包公司合肥关键词优化平台
  • wordpress站群教程桂林象鼻山门票价格
  • 做兼职网上哪个网站好网页游戏开服表 怎么删除
  • 如何自己搭建网站专业写作网站
  • 厦门+外贸公司做网站厦门市建设局与管理局网站
  • 昆明网站建设代理江门外贸集团有限公司英文网站
  • 网站卖东西怎么做的郑州妇科医院哪个医院最好
  • 好的俄文网站设计ppt怎么做
  • 江西省水利水电建设集团招标网站东莞汽车总站停止营业
  • 网站建设论文答辩ppt网站建设logo设计
  • 外包做的网站可以直接去收录吗腾讯街景地图实景下载
  • 设计网站意味着什么工作室是个体户还是公司
  • 建设银行秋招网站页面设计的特点是什么
  • 微信平台的微网站怎么做全景网站是怎么做的
  • 提供网站建设教学视频便宜的国外云服务器
  • 做薪酬调查的网站ps网站怎么做滑动背景
  • 哪个网站做医学培训好南陵网站建设
  • 国内做微商城比较知名的网站公司网站建设规划
  • 网站及建设中页面nodejs做网站能保护源代码吗
  • 服装集团网站建设产品宣传推广方案
  • 师范街网站建设项目开发的五个阶段
  • 协会网站建设必要性长春网站分析
  • 网站维护主要内容网站建设费按几年摊销
  • 自己怎么建设购物网站投资公司名字
  • 杭州企业网站制作公司wordpress的页面链接错乱