当前位置: 首页 > news >正文

网站做301的坏处做网站的毕业设计

网站做301的坏处,做网站的毕业设计,如何给网站挂黑链,建设局怎么样划分依据 基尼系数基尼系数的应用信息熵信息增益信息增益的使用信息增益准则的局限性 最近在学习项目的时候经常用到随机森林#xff0c;所以对决策树进行探索学习。 基尼系数 基尼系数用来判断不确定性或不纯度#xff0c;数值范围在0~0.5之间#xff0c;数值越低#x… 划分依据 基尼系数基尼系数的应用信息熵信息增益信息增益的使用信息增益准则的局限性 最近在学习项目的时候经常用到随机森林所以对决策树进行探索学习。 基尼系数 基尼系数用来判断不确定性或不纯度数值范围在0~0.5之间数值越低数据集越纯。 基尼系数的计算 假设数据集有K个类别类别K在数据集中出现的概率为Pk则基尼系数为 上式是用来求某个节点的基尼系数要求某个属性的基尼系数用下面的公式 最后选择基尼系数最小的属性进行划分即可。 基尼系数的应用 在决策树中假如某个节点的基尼系数就是0此时被分类到这个节点的数据集是纯的意思就是按照此叶节点的父节点的分类方法来说此叶节点都是同一个类别的不需要再次分裂决策。 信息熵 信息熵和基尼系数作用相同都是用来度量样本集合纯度的指标。 计算方法 Pk是当前样本集合中第k类样本所占比例Ent(D)(信息熵)越小集合D的纯度越高。 这里约定当Pk为0时Ent(D)0 信息增益 计算公式 假设现在对集合D使用属性a来进行划分属性a有v个取值也就是有v个节点上式中Dv是第v个节点就是取值为v的样本个数。 信息增益的使用 信息增益越大说明使用属性a来划分所获得的纯度提升越大决策树越好。 信息增益准则的局限性 从上面的公式可以看出信息增益偏好可取值数目较多的属性假如某个属性可取值达到了n也就是每个样本都不一样比如“编号”属性那可以计算出这个属性的信息增益接近1选择这样的属性来划分很可能不具有泛化能力。 改进 使用增益率 对于这个公式当属性a的可取值越多时则IV(a)会越大增益率变小进行了平衡。同样的增益率准则也有局限它对可取值较少的属性又有所偏好。 最终先找出信息增益高于平均水平的属性再从中选择增益率最高的即可。
http://www.dnsts.com.cn/news/57779.html

相关文章:

  • 几种语言的网站如何做中国建筑材料集团有限公司
  • 智慧团登录官方网站wordpress老是打不开
  • 武清网站开发织梦网如何把做网站的删掉
  • 好用的网站开发框架湖南人文科技学院录取查询
  • wordpress文章固定链接西安网站优化效果
  • 莱西做网站免费模板下载word
  • 收费网站推广怎么注册电商平台
  • 岚山网站建设网络推广外包哪个公司做的比较好
  • 动态ip上做网站北京兼职做网站建设
  • 太原网站建设网站做网站电商
  • asp做网站简介页面最新军事战争新闻
  • 阀门行业网站怎么做科凡官网
  • 重庆网站建设首选卓光wap网站和app开发
  • 优秀的网站建设托管微信网站用什么软件做
  • 建湖网站建设公司素材下载网站源码
  • 网站开发json解析律师网络推广哪个比较好
  • 网站开发要用多少钱wordpress维护费用
  • 拖拽式wordpress建站wordpress全屏弹窗插件
  • 网站开发网上宠物店管理系统移动网站套餐
  • 企业网站功能列表现在有什么推广平台
  • 网页设计导航栏内容班级优化大师手机版下载(免费)
  • 做旅游网站的公司求合伙人做网站
  • 十堰高端网站建设开发高端网站建设价格
  • 带域名的网站打不开网站建设与建设
  • 网站说说模板.嘉兴房产网站建设
  • 网站的建设维护南阳做网站多少钱
  • 湖南省新邵县建设局网站海外电商平台哪个好
  • 招商网站建设费用价格腾讯云服务器使用教程
  • 个人做网站能赚钱吗做广告公司网站建设价格
  • 网站建设付费项目做网站 租服务器