当前位置: 首页 > news >正文

创建网站制作仪表企业app开发网上app开发

创建网站制作仪表企业,app开发网上app开发,wordpress 后台主题,网站建设 seo semMTCNN#xff08;Multi-task Cascaded Convolutional Networks#xff09;是一种用于人脸检测和关键点检测的深度学习模型#xff0c;特别适合在复杂背景下识别出多尺度的人脸。它通过多任务学习来实现人脸检测和人脸关键点定位#xff08;如眼睛、鼻子、嘴巴的位置#x…MTCNNMulti-task Cascaded Convolutional Networks是一种用于人脸检测和关键点检测的深度学习模型特别适合在复杂背景下识别出多尺度的人脸。它通过多任务学习来实现人脸检测和人脸关键点定位如眼睛、鼻子、嘴巴的位置实现高精度的人脸区域定位和关键点提取。MTCNN 主要由三个级联网络组成P-Net、R-Net 和 O-Net。 论文名称《Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks》https://arxiv.org/pdf/1604.02878https://arxiv.org/pdf/1604.02878 一、MTCNN 的网络结构 1.P-NetProposal Network 作用快速生成候选窗口。结构P-Net 是一个全卷积神经网络负责从图片中生成初步的人脸候选框并进行非最大值抑制NMS保留主要候选窗口。输出人脸置信度和候选框回归参数。 P-NetProposal Network——生成候选框 网络结构P-Net 是一个轻量级的卷积网络由三层卷积层构成每一层后面都有 ReLU 激活函数。 Conv13x3 卷积核步长为 1输出 10 个通道的特征图。Max Pooling12x2 池化步长为 2。Conv23x3 卷积核步长为 1输出 16 个通道的特征图。Conv33x3 卷积核步长为 1输出 32 个通道的特征图。 输出层 分类层Cls1x1 卷积核输出通道数为 2表示人脸和非人脸的置信度。回归层Reg1x1 卷积核输出通道数为 4用于预测人脸框的偏移量。 功能 P-Net 接收输入图像生成初步的人脸候选框并输出每个候选框的置信度人脸概率和位置偏移。应用非最大值抑制NMS去除重叠度高的候选框减少冗余检测框。 2.R-NetRefine Network 作用精确化候选框。结构接收 P-Net 生成的候选窗口并过滤掉部分错误窗口进一步提高人脸检测精度。输出细化的人脸置信度和候选框位置。 R-NetRefine Network——筛选候选框 网络结构R-Net 是一个中等复杂度的卷积网络包含三层卷积层和一个全连接层。 Conv13x3 卷积核步长为 1输出 28 个通道的特征图。Max Pooling13x3 池化步长为 2。Conv23x3 卷积核步长为 1输出 48 个通道的特征图。Max Pooling23x3 池化步长为 2。Conv32x2 卷积核步长为 1输出 64 个通道的特征图。全连接层输出 128 维特征向量并与 ReLU 激活函数连接。 输出层 分类层Cls二分类输出检测候选区域是否包含人脸。回归层Reg输出人脸框位置的四个偏移值。 功能 R-Net 接收 P-Net 的候选框并进一步筛选和校正候选框的边界。再次进行非最大值抑制去除相邻且重叠较高的框。 3.O-NetOutput Network 作用最终的人脸框确定与关键点检测。结构输入来自 R-Net 的候选窗口进一步细化人脸检测框最终输出人脸的精确位置和五个关键点眼睛、鼻子、嘴巴位置。输出最终的人脸框、五个关键点的坐标。 O-NetOutput Network——精确定位并检测关键点 网络结构O-Net 是一个相对复杂的网络用于最终的精确化。 Conv13x3 卷积核步长为 1输出 32 个通道的特征图。Max Pooling13x3 池化步长为 2。Conv23x3 卷积核步长为 1输出 64 个通道的特征图。Max Pooling23x3 池化步长为 2。Conv33x3 卷积核步长为 1输出 64 个通道的特征图。Max Pooling32x2 池化步长为 2。Conv42x2 卷积核步长为 1输出 128 个通道的特征图。全连接层输出 256 维特征向量连接 ReLU 激活函数。 输出层 分类层Cls二分类输出用于最终人脸的判断。回归层Reg输出人脸框位置的四个偏移值。关键点检测层Landmarks输出 5 个关键点的坐标位置包括左右眼、鼻尖、嘴角。 功能 O-Net 负责进一步细化人脸边框并预测五个关键点。通过关键点预测进一步提高检测框的精度。 二、级联架构的优点 MTCNN 级联网络架构具有显著的计算效率优势 逐步筛选P-Net 的计算最为轻量用于快速筛选大量非人脸区域。后续网络只需处理少量高置信度候选框减少计算量。逐级优化每个网络的输出作为下一网络的输入通过级联的方式候选框的位置和精度得到逐步优化。多任务学习由于 O-Net 同时进行人脸检测和关键点检测利用共享特征实现多任务提升了模型的整体性能和检测精度。 三、MTCNN 的训练目标 MTCNN 通过多任务损失函数来训练即结合了分类损失、边框回归损失和关键点回归损失目标是 人脸分类损失最小化人脸与非人脸的分类误差。边框回归损失减小候选框的回归偏差保证框的位置更准确。关键点回归损失保证五个关键点的回归误差最小化以获得更精确的关键点位置。 四、代码实现 该源码是基于pytorch框架实现源码的GitHub开源地址为https://github.com/TropComplique/mtcnn-pytorchhttps://github.com/TropComplique/mtcnn-pytorch
http://www.dnsts.com.cn/news/92885.html

相关文章:

  • 如何做网站主页网站建设需要度搜去
  • sem竞价教程搜索引擎优化文献
  • 无锡网站建设优化公司蚌埠网站建设公司cztv
  • 太原高级seo主管宁波seo推广优化怎么做
  • 做外贸学网站怎么部署自己的网站
  • 网站301检测建设银行江苏省行网站
  • 上海市网站seo公司桂林百姓网
  • 网站需要哪些证件安仁网络推广软件定制开发
  • 自己的网站怎么做美工洪泽网站建设
  • 建网站用什么工作站最简单的做网站
  • 分类信息网站的建设维护页面设计有哪几种风格
  • 3深圳网站建设赣州网络公司电话
  • 目前建设网站中国移动积分商城
  • 长沙简单的网站建设公司自行网站建设费用预算
  • 网站留言程序怎么做网站建设与网页制作教程
  • 网站域名实名认证wordpress关闭略缩图
  • 西安网站建设推广服务大型局域网组建方案
  • 电子商务网站建设思维导图济南城市建设集团 网站
  • 什么网站可以帮别人做数据分析赚钱在线做数据图的网站
  • 设计制作网站的公司路由器端口转发做网站访问量
  • 网站二级域名怎么做wordpress自定义字段判断
  • 冠县做网站河南省住房和城乡建设厅电话
  • 网站推广模板汽车技术资料网站建设
  • 广州网站建设公司小程序wordpress计费查询
  • 深圳网站搭建哪里找哪里有网站建设联系方式
  • 如何在百度上建立自己的网站河北建设人才网官网
  • 营销型网站的要素asp.net网站sql权限设置
  • 一般网站栏目结构深圳微信网站公司哪家好
  • 免费cad图纸下载网站广州有哪些做网站的公司
  • 有哪个网站做ic浙江省2011年1月高等教育自学考试 网站建设与管理试题与答案