当前位置: 首页 > news >正文

oto网站开发梧州做网站建设

oto网站开发,梧州做网站建设,单页网站模板修改吗,公司注册免费吗判断选择什么模型#xff0c;什么量化方案#xff0c;什么推理框架#xff0c;最基础的知识就是如何评估自己的模型以及推理平台。 模型衡量标准 衡量一个模型的最直接标准就是运算速度#xff0c;但是运算速度是无法计算的#xff0c;所以定义了一些间接标准来推测模型的… 判断选择什么模型什么量化方案什么推理框架最基础的知识就是如何评估自己的模型以及推理平台。 模型衡量标准 衡量一个模型的最直接标准就是运算速度但是运算速度是无法计算的所以定义了一些间接标准来推测模型的运算速度。这些标准不仅仅可以用来选择模型的量化方案在设计模型时也应该有所参考。 模型计算量FLOPs Floating point operations浮点运算数量代表一次推理需要的浮点运算次数 注意不要与FLOPS混淆FLOPS是floating point operations per second指芯片每秒浮点运算数量用于衡量芯片的运算能力。 例如对于一个普通CNN卷积层输入尺寸为 C o u t × H × W C_{out}\times H\times W Cout​×H×W输出尺寸相同卷积核尺寸 K 3 K3 K3添加偏置 b i a s bias bias 一次卷积的运算量 乘法: C i n K 2 C_{in} K^2 Cin​K2加法: C i n ( K 2 − 1 ) ( C i n − 1 ) 1 C i n K 2 C_{in}(K^2-1)(C_{in}-1)1C_{in}K^2 Cin​(K2−1)(Cin​−1)1Cin​K2 输出尺寸 C o u t × H × W C_{out}\times H\times W Cout​×H×W中的每个像素点都是一次卷积运算量共计 2 C i n C o u t H W × K 2 2C_{in}C_{out}HW\times K^2 2Cin​Cout​HW×K2 计算方法的不同以及是否添加bias导致算出来的结果可能不完全一样无所谓FLOPs这种就跟算法中的复杂度O(n)差不多常数不会对结果产生数量级的影响。 FLOPs只是一个衡量标准还有其他的衡量标准例如MACCsmultiply-accumulate operations乘-加操作次数一次乘法一次加法为一个MACCsMACCs 大约是 FLOPs 的一半。 模型参数量parameters 顾名思义模型的参数总量 例如对于普通CNN卷积层一共有 C i n C o u t C_{in}C_{out} Cin​Cout​个卷积核参数量 C i n C o u t × K 2 C_{in}C_{out}\times K^2 Cin​Cout​×K2 模型内存访问代价MAC 一次前向推理的过程中模型内存交换的总量体现了模型的空间复杂度。 模型计算强度 I F L O P s M A C I\frac{FLOPs}{MAC} IMACFLOPs​表示每次内存交换对应多少次浮点运算计算强度越大模型内存利用率越高 模型量化就约等于是运算量不变但是每次运算本来要读取fp324个字节现在换成了读取int81个字节MAC降低了模型计算强度提高了。 推理平台衡量标准 算力FLOPS 每秒浮点数运算次数(用 π \pi π来表示) 带宽 每秒的内存交换量(用 β \beta β表示) 计算强度上限 I m a x π β I_{max}\frac{\pi}{\beta} Imax​βπ​ 理论上模型的计算强度刚好达到推理平台的计算强度上限时性能最佳这个理论最佳性能称为roof-line。计算强度低于 I m a x I_{max} Imax​时被称为带宽瓶颈区这时推理平台的性能没有完全发挥出来性能的上限取决于模型的计算强度计算强度高于 I m a x I_{max} Imax​时称为计算瓶颈区平台的算力得到了充分利用。 不过想要达到roof-line不是光考虑模型的计算量和内存访问代价就够的。因为实际计算过程中还有除算力和带宽之外的其他重要因素它们也会影响模型的实际性能这是 Roofline Model 未考虑到的。例如矩阵乘法会因为 cache 大小的限制、GEMM 实现的优劣等其他限制导致你几乎无法达到 Roofline 模型所定义的边界屋顶。 GEMM指通用矩阵乘法这个在后面的blog中我们也要讲到多年来数学家和计算机科学家都在努力优化矩阵乘法但是进展不大最近清华姚班大佬发了一篇paper被称为十年来矩阵乘法的最大优化有空可以读一下 论文地址https://epubs.siam.org/doi/10.1137/1.9781611977912.134 多年来矩阵乘法优化算法的发展历程 pytorch社区中的一篇讲解矩阵乘法的bloghttps://pytorch.org/blog/inside-the-matrix/ 解放双手 这么复杂的运算自然不会是考我们人手工计算然后评估模型实际上有很多用于评估模型的库实践如下 pytorch自行计算 如果只是评估模型参数量不需要进行借助工具直接两行代码就搞定 from torchvision.models import resnet50model resnet50() total sum([param.nelement() for param in model.parameters()]) print(parameter:%fM % (total/1e6))Torchstat 统计模型的参数量、计算量、访存量等指标且会针对模型的每层指标进行打印部分指标与常见含义不同具体会结合yolov5的指标进行介绍只对常见网络层进行统计安装方法如下 pip install torchstat使用方法如下 import torch import torchvision.models as models from torchstat import statmodel models.resnet50(pretrainedTrue)# 使用torchstat的stat函数来分析模型 stat(model, (3, 224, 224))Thop top这个词在计算机领域很常见很多关系到性能的都会有top这个词例如Linux平台下的性能管理工具topJetson中的性能检测工具jtop。这是为啥呢不懂。 统计模型的参数量和计算量部分指标与常见含义不同具体会结合yolov5的指标进行介绍只对常见网络层进行统计安装方法如下 pip install thop使用方法如下 from torchvision.models import resnet50 from thop import profile model resnet50() input torch.randn(1, 3, 224, 224) flops, params profile(model, inputs(input, )) print(FLOPs, str(flops/1e9) {}.format(G)) print(params, str(params/1e6) {}.format(M))更复杂的使用建议用到了再去翻文档学习工具类的提前学习没有意义。 如果感觉有帮助点赞收藏关注thanks
http://www.dnsts.com.cn/news/23307.html

相关文章:

  • 用ps做网站主页单品商城网站源码
  • 网站在哪做易企秀可以做网站吗
  • 自然堂官方网站建设wordpress留学主题
  • 网页设计网站开发需要什么软件电子商务网站建设编码
  • 蜂蜜网站建设襄阳 网站建设
  • 做金融服务网站赚钱黑马程序员怎么样
  • 网站备案后的标识怎么把园林设计网站做的酷炫
  • 太原百度做网站多少钱建筑网方成龙
  • 基础展示营销型型网站wordpress改菜单字体大小
  • 北京网站建设公司 网络服务wordpress邮箱验证配置文件
  • 做电影网站要不要收费的做最简单的网站
  • 建设银行官方网站买五粮液酒wordpress 自动 发微博
  • 天河区网站制作超级优化还原
  • 网站注册用户推广电子商务网络运营
  • 企业做网站的目的动漫制作专业职业定位
  • 潮州做网站湖北省建设人力资源网站
  • 网站点击按钮排序民治网站设计圳网站建设公司
  • 网站建设 页面互联网行业前景分析
  • 教学网站怎么做php 向网站发送数据
  • 网站建设与管理期末考试题全网平台整合营销推广
  • 网站建设按钮flash做网站
  • e时代速递搜索引擎网站建设移动端开发框架
  • 宁波网站建设开发多少钱个人购物网站怎么做
  • 餐饮公司网站模板专业做化妆品外包材的招聘网站
  • 建外贸网站用什么主机wordpress style.
  • 学校html网站模板代码网页设计模板免费下载田田田田田田田田田田
  • 电子商务网站建设 期末考试试卷以及答案wordpress 源码讲解
  • 17zwd一起做网站株洲站成都保洁公司
  • 织梦网站footer美化仿站
  • 做性的网站有哪些任务发布网站建设