二手购物网站策划书,沐风模板WordPress,网站建设问题及对策,贵州健康码app下载目录
卷积神经网络 – CNN
CNN 解决了什么问题#xff1f;
需要处理的数据量太大
保留图像特征
人类的视觉原理
卷积神经网络-CNN 的基本原理
卷积——提取特征
池化层#xff08;下采样#xff09;——数据降维#xff0c;避免过拟合
全连接层——输出结果
CNN …目录
卷积神经网络 – CNN
CNN 解决了什么问题
需要处理的数据量太大
保留图像特征
人类的视觉原理
卷积神经网络-CNN 的基本原理
卷积——提取特征
池化层下采样——数据降维避免过拟合
全连接层——输出结果
CNN 有哪些实际应用
总结
百度百科维基百科 卷积层负责提取图像中的局部特征
池化层用来大幅降低参数量级(降维)
全连接层类似传统神经网络的部分用来输出想要的结果。
卷积神经网络 – CNN 卷积神经网络 – CNN 最擅长的就是图片的处理。它受到人类视觉神经系统的启发。 CNN 有2大特点 能够有效的将大数据量的图片降维成小数据量能够有效的保留图片特征符合图片处理的原则 目前 CNN 已经得到了广泛的应用比如人脸识别、自动驾驶、美图秀秀、安防等很多领域。 CNN 解决了什么问题
在 CNN 出现之前图像对于人工智能来说是一个难题有2个原因
图像需要处理的数据量太大导致成本很高效率很低图像在数字化的过程中很难保留原有的特征导致图像处理的准确率不高 需要处理的数据量太大
图像是由像素构成的每个像素又是由颜色构成的。 现在随随便便一张图片都是 1000×1000 像素以上的 每个像素都有RGB 3个参数来表示颜色信息。
假如我们处理一张 1000×1000 像素的图片我们就需要处理3百万个参数
1000×1000×33,000,000
这么大量的数据处理起来是非常消耗资源的而且这只是一张不算太大的图片
卷积神经网络 – CNN 解决的第一个问题就是“将复杂问题简化”把大量参数降维成少量参数再做处理。
更重要的是我们在大部分场景下降维并不会影响结果。比如1000像素的图片缩小成200像素并不影响肉眼认出来图片中是一只猫还是一只狗机器也是如此。 保留图像特征
图片数字化的传统方式我们简化一下就类似下图的过程 假如有圆形是1没有圆形是0那么圆形的位置不同就会产生完全不同的数据表达。但是从视觉的角度来看图像的内容本质并没有发生变化只是位置发生了变化。
所以当我们移动图像中的物体用传统的方式的得出来的参数会差异很大这是不符合图像处理的要求的。
而 CNN 解决了这个问题他用类似视觉的方式保留了图像的特征当图像做翻转旋转或者变换位置时它也能有效的识别出来是类似的图像。
那么卷积神经网络是如何实现的呢在我们了解 CNN 原理之前先来看看人类的视觉原理是什么
人类的视觉原理
深度学习的许多研究成果离不开对大脑认知原理的研究尤其是视觉原理的研究。
1981 年的诺贝尔医学奖颁发给了 David Hubel出生于加拿大的美国神经生物学家 和TorstenWiesel以及 Roger Sperry。前两位的主要贡献是“发现了视觉系统的信息处理”可视皮层是分级的。
人类的视觉原理如下从原始信号摄入开始瞳孔摄入像素 Pixels接着做初步处理大脑皮层某些细胞发现边缘和方向然后抽象大脑判定眼前的物体的形状是圆形的然后进一步抽象大脑进一步判定该物体是只气球。下面是人脑进行人脸识别的一个示例 对于不同的物体人类视觉也是通过这样逐层分级来进行认知的 我们可以看到在最底层特征基本上是类似的就是各种边缘越往上越能提取出此类物体的一些特征轮子、眼睛、躯干等
到最上层不同的高级特征最终组合成相应的图像从而能够让人类准确的区分不同的物体。 那么我们可以很自然的想到可以不可以模仿人类大脑的这个特点构造多层的神经网络
较低层的识别初级的图像特征若干底层特征组成更上一层特征
最终通过多个层级的组合最终在顶层做出分类呢
答案是肯定的这也是许多深度学习算法包括CNN的灵感来源。
卷积神经网络-CNN 的基本原理
典型的 CNN 由3个部分构成
卷积层池化层全连接层
如果简单来描述的话
卷积层负责提取图像中的局部特征
池化层用来大幅降低参数量级(降维)
全连接层类似传统神经网络的部分用来输出想要的结果。 卷积——提取特征
卷积层的运算过程如下图用一个卷积核扫完整张图片 这个过程我们可以理解为我们使用一个过滤器卷积核来过滤图像的各个小区域从而得到这些小区域的特征值。
在具体应用中往往有多个卷积核可以认为每个卷积核代表了一种图像模式如果某个图像块与此卷积核卷积出的值大则认为此图像块十分接近于此卷积核。
如果我们设计了6个卷积核可以理解我们认为这个图像上有6种底层纹理模式也就是我们用6中基础模式就能描绘出一副图像。以下就是25种不同的卷积核的示例 总结卷积层的通过卷积核的过滤提取出图片中局部的特征跟上面提到的人类视觉的特征提取类似。 池化层下采样——数据降维避免过拟合
池化层简单说就是下采样他可以大大降低数据的维度。其过程如下 上图中我们可以看到原始图片是20×20的我们对其进行下采样采样窗口为10×10最终将其下采样成为一个2×2大小的特征图。
之所以这么做的原因是因为即使做完了卷积图像仍然很大因为卷积核比较小所以为了降低数据维度就进行下采样。
总结池化层相比卷积层可以更有效的降低数据维度这么做不但可以大大减少运算量还可以有效的避免过拟合。 全连接层——输出结果
这个部分就是最后一步了经过卷积层和池化层处理过的数据输入到全连接层得到最终想要的结果。
经过卷积层和池化层降维过的数据全连接层才能”跑得动”不然数据量太大计算成本高效率低下。 典型的 CNN 并非只是上面提到的3层结构而是多层结构例如 LeNet-5 的结构就如下图所示
卷积层 – 池化层- 卷积层 – 池化层 – 卷积层 – 全连接层 在了解了 CNN 的基本原理后我们重点说一下 CNN 的实际应用有哪些。
CNN 有哪些实际应用
卷积神经网络 – CNN 很擅长处理图像。而视频是图像的叠加所以同样擅长处理视频内容。下面给大家列一些比较成熟的应用
图像分类、检索
图像分类是比较基础的应用他可以节省大量的人工成本将图像进行有效的分类。对于一些特定领域的图片分类的准确率可以达到 95%已经算是一个可用性很高的应用了。
典型场景图像搜索… 目标定位检测
可以在图像中定位目标并确定目标的位置及大小。
典型场景自动驾驶、安防、医疗… 目标分割
简单理解就是一个像素级的分类。
他可以对前景和背景进行像素级的区分、再高级一点还可以识别出目标并且对目标进行分类。
典型场景美图秀秀、视频后期加工、图像生成… 人脸识别
人脸识别已经是一个非常普及的应用了在很多领域都有广泛的应用。
典型场景安防、金融、生活… 骨骼识别
骨骼识别是可以识别身体的关键骨骼以及追踪骨骼的动作。
典型场景安防、电影、图像视频生成、游戏… 总结
今天我们介绍了 CNN 的价值、基本原理和应用场景简单总结如下
CNN 的价值
能够将大数据量的图片有效的降维成小数据量(并不影响结果)能够保留图片的特征类似人类的视觉原理
CNN 的基本原理
卷积层 – 主要作用是保留图片的特征池化层 – 主要作用是把数据降维可以有效的避免过拟合全连接层 – 根据不同任务输出我们想要的结果
CNN 的实际应用
图片分类、检索目标定位检测目标分割人脸识别骨骼识别 卷积神经网络Convolutional Neural Networks, CNN是一类包含卷积计算且具有深度结构的前馈神经网络Feedforward Neural Networks是深度学习deep learning的代表算法之一 。由于卷积神经网络能够进行平移不变分类shift-invariant classification因此也被称为“平移不变人工神经网络Shift-Invariant Artificial Neural Networks, SIANN” 。
对卷积神经网络的研究始于二十世纪80至90年代时间延迟网络和LeNet-5是最早出现的卷积神经网络在二十一世纪后随着深度学习理论的提出和数值计算设备的改进卷积神经网络得到了快速发展并被大量应用于计算机视觉、自然语言处理等领域 。 在深度学习中卷积神经网络CNN或ConvNet是一类深度神经网络最常用于分析视觉图像。
CNN使用多层感知器的变体设计需要最少的预处理。它们也被称为移位不变或空间不变人工神经网络SIANN基于它们的共享权重架构和平移不变性特征。卷积网络被启发由生物工艺在之间的连接图案的神经元类似于动物的组织视觉皮层。个体皮层神经元仅在被称为感受野的视野的受限区域中对刺激作出反应。不同神经元的感受野部分重叠使得它们覆盖整个视野。
与其他图像分类算法相比CNN使用相对较少的预处理。这意味着网络学习传统算法中手工设计的过滤器。这种与特征设计中的先前知识和人力的独立性是一个主要优点。
它们可用于图像和视频识别推荐系统图像分类医学图像分析和自然语言处理。