当前位置: 首页 > news >正文

宝山网站建设推广购物链接

宝山网站建设推广,购物链接,建设网站的网站公告是什么,做网站搭建环境最近做项目遇到的数据集中#xff0c;有许多高维类别特征。catboost是可以直接指定categorical_columns的【直接进行ordered TS编码】#xff0c;但是XGboost和随机森林甚至决策树都没有这个接口。但是在学习决策树的时候#xff08;无论是ID3、C4.5还是CART#xff09;有许多高维类别特征。catboost是可以直接指定categorical_columns的【直接进行ordered TS编码】但是XGboost和随机森林甚至决策树都没有这个接口。但是在学习决策树的时候无论是ID3、C4.5还是CART肯定都知道决策树可以直接天然处理离散特征那难道sklearn的决策树可以自己判断哪些特征是离散or连续 决策树怎么处理连续特征 首先要明确分类树和回归树只是看label值是类别型还是连续型和特征中是离散还是连续没有关系。并不是说CART回归树不能使用离散的特征只是CART回归树里并不使用gini系数来计算增益。【补充题外话CART作为一个二叉树每次分列并不会和ID3一样消耗这一列特征只是消耗了该特征的一个分界点】 关于特征为连续属性时CART决策树如何处理二分法——先从小到大依次排序然后依次划分进行判定。具体可以参考这篇博客。 sklearn里的决策树怎么处理类别特征的 答案是——不处理。在sklearn实现的CART树中是用同一种方式去处理离散与连续的特征的即把离散的特征也都当做连续的处理了只能处理连续特征 和 做编码成数字的离散特征。 可以看这个问题我的理解是sklearn为了速度对CART的原来算法做了一定的改进不再按照原来的方法处理离散特征而是都统一成连续特征来处理了【所以没有categorical_columns接口】。 其实理论上来说XGB是可以用离散变量的毕竟增益只和结点上的样本有关特征只是决定树的结构 解决方案 如果想使用DT、RF、XGB离散特征需要人为进行处理。可以看这个博客对类别特征进行编码。如果类别不是很多可以考虑用one-hot尽管决策树不太欢迎onehot类别特征太多的就要考虑用target encoding或者catboost encoding等编码方式来处理了。 另一方面一些实际应用的结果表明在特征维度很大的情况下直接把每个特征编码成数字然后当做数值特征来用其实效果并不会比严格按照categorical来使用差很多或许可以考虑直接用LabelEncoder直接对高维类别特征进行编码转化为数值特征。 或者考虑换LGBM、CatBoost
http://www.dnsts.com.cn/news/281512.html

相关文章:

  • 英网站建设wordpress用户头像插件
  • 湘西州建设银行网站站长网站素材网
  • 怎样建设凡科网站免费下载京东购物
  • 伍佰亿是什么网站it人力外包
  • 手机版网站用什么开发的广州市网站建设需要审批
  • 采网站建设php技术的网站建设实录方案
  • 广众人才网猎头网站建设pc端网站建设哪里有
  • wordpress 整站播放器wordpress 数据
  • 微信分享网站显示图片厦门企业自助建站
  • 山东济南seo整站优化公司商家货源网
  • php发布post到wordpress网络优化是干什么的
  • 海西州电子商务网站建设公司wordpress菜单跳转页面跳转
  • 建设网站需要会什么室内设计需要什么学历
  • 百度高级搜索网址做网站推广优化
  • wordpress网站 搬家佛山新网站建设流程
  • 网站头部怎么做做招聘长图用什么网站
  • 慈溪做网站什么价安阳网站建设公司出租车公司
  • 珠海建网站xwiki做的网站
  • 兰州做网站的成都网站开发建
  • 宁波seo整体优化乐陵seo优化推广
  • 只放一个图片做网站办公oa系统大概多少钱
  • 建筑素材网站响应式官网模板
  • 成都市微信网站建设做兼职上什么网站找
  • 网站建设过程小结文职培训机构前十名
  • 网站搜索排名怎么做新闻发布会新闻通稿
  • 图片分页网站模板便民网
  • 黑色风格网站主页面企业主题wordpress 含演示数据
  • 怎样做好物流网站建设网站开发 怎样做费用结算
  • 好一点的网站建设常见的网络营销策略都有哪些
  • 做思维导图的资源网站厦门建设局招聘