当前位置: 首页 > news >正文

专业做网站公司哪家技术好wordpress 多重筛选

专业做网站公司哪家技术好,wordpress 多重筛选,首都博物馆 网站建设,怎么做展示网站随机森林#xff08;Breiman 2001a#xff09;#xff08;RF#xff09;是一种非参数统计方法#xff0c;需要没有关于响应的协变关系的分布假设。RF是一种强大的、非线性的技术#xff0c;通过拟合一组树来稳定预测精度模型估计。随机生存森林#xff08;RSF#xff0…随机森林Breiman 2001aRF是一种非参数统计方法需要没有关于响应的协变关系的分布假设。RF是一种强大的、非线性的技术通过拟合一组树来稳定预测精度模型估计。随机生存森林RSFIshwaran和Kogalur2007IshwaraanKogalur、Blackstone和Lauer2008是Breimans射频技术的延伸从而降低了对时间到事件数据的有效非参数分析。 R语言随机森林进行生存分析需要使用到randomForestSRC包是对Breimans随机森林的统一处理用于生存、回归和分类问题。randomForestSRC包还有一个用于做图的ggRandomForests包搭配使用今天咱们来介绍一下怎么使用randomForestSRC包进行随机森林生存分析内容有点多咱们分2章来介绍。 咱们先导入数据和R包 library(ggRandomForests) library(randomForestSRC) library(ggplot2) library(dplyr) pbc-read.csv(E:/r/test/pbc2.csv,sep,,headerTRUE)这是一个胆管炎数据公众号回复胆管炎数据2可以获得数据years:生存时间status结局指标是否死亡treatment是否DPCA治疗age年龄sex性别ascites是否有腹水hepatom是否有肝肿大spiders是否有蜘蛛痣edema水肿的级别bili胆红素chol胆固醇albumin白蛋白copper尿酮alk碱性磷酸酶sgotSGOT评分trig甘油三酯platelet血小板prothrombin凝血酶时间stage组织学分型 我们对数据处理一下把treatment这个变量变成因子 pbc$treatment-factor(pbc$treatment)接下来咱们把数据分成两组有treatment数据的为测试组treatment数据缺失的为对照组。 pbc.trial - pbc %% filter(!is.na(treatment)) pbc.test - pbc %% filter(is.na(treatment))我们先用生存分析做一遍等下可以和随机森林进行比较接下来我们用gg_survival对测试组生成生存分析的数据这个函数挺方便使用的生成了生存分析的详尽数据 gg_dta -gg_survival(interval years,censor status,by treatment,data pbc.trial,conf.int 0.95)绘图 plot(gg_dta) labs(y Survival Probability, x Observation Time (years),color Treatment, fill Treatment) theme(legend.position c(0.2, 0.2)) coord_cartesian(y c(0, 1.01))或者绘制成这种累积风险图 plot(gg_dta, type cum_haz) labs(y Cumulative Hazard, x Observation Time (years),color Treatment, fill Treatment) theme(legend.position c(0.2, 0.8)) coord_cartesian(ylim c(-0.02, 1.22))咱们还可以进行断点分层分析假如咱们对bili这个指标分层4个层(0, 0.8, 1.3, 3.4, 29) pbc.bili - pbc.trial pbc.bili$bili_grp - cut(pbc.bili$bili, breaks c(0, 0.8, 1.3, 3.4, 29)) plot(gg_survival(interval years, censor status, by bili_grp,data pbc.bili), error none) labs(y Survival Probability, x Observation Time (years),color Bilirubin)接下来咱们进行随机森林的生存分析nsplit定义的是随机拆分数一般默认10次na.action这里如果选择na.impute就是对缺失数据进行插补如果选择na.omit就是对缺失数据删除importance TRUE这里会计算重要的变量并且进行排序 rfsrc_pbc - rfsrc(Surv(years, status) ~ ., data pbc.trial,nsplit 10, na.action na.impute,tree.err TRUE,importance TRUE)查看下基本信息默认ntree是1000颗数No. of variables tried at each split: 5这里表示每次都随机取5个变量用于截点。在每个节点当终端节点包含三个或更少的观测值时停止。Rfsrc函数采用了一个随机logrank分割规则该规则从nsplit10中随机选择分割点值。 rfsrc_pbc程序选择63.2%的样本做估计剩余36.8%作为袋外数据OOB用于测试。gg_error函数对随机林rfsrc_pbc对象进行操作以提取错误作为森林中树木数量的函数的估计。 plot(gg_error(rfsrc_pbc))我们可以看到100颗数后误差已经很稳定了。gg_rfsrc函数可以提取随机森林中袋外数据OOB的估计值 out- gg_rfsrc(rfsrc_pbc)进一步绘图 ggRFsrc - plot(gg_rfsrc(rfsrc_pbc), alpha 0.2) theme(legend.position none) labs(y Survival Probability, x Time (years)) coord_cartesian(ylim c(-0.01, 1.01)) ggRFsrc对治疗组和未治疗组进行分类绘图 plot(gg_rfsrc(rfsrc_pbc, by treatment)) theme(legend.position c(0.2, 0.2)) labs(y Survival Probability, x Time (years)) coord_cartesian(ylim c(-0.01, 1.01))使用验证组就行数据评估 rfsrc_pbc_test - predict(rfsrc_pbc, newdata pbc.test,na.action na.impute,importance TRUE)绘图 plot(gg_rfsrc(rfsrc_pbc_test), alpha.2) #scale_color_manual(values strCol) theme(legend.position none) labs(y Survival Probability, x Time (years)) coord_cartesian(ylim c(-0.01, 1.01))因为咱们选的是treatment缺失的为验证集这里就不能分组了。 随机林不是一种简约方法而是使用数据集中所有可用的变量以构建响应预测器。此外与参数模型不同随机森林不会要求明确说明协变量对响应的函数形式。因此对于随机森林模型的变量选择没有明确的p值/显著性检验。相反RF通过分割规则确定哪些变量对预测有贡献优化最佳选择分离观察的变量。 下面来做变量的重要性VIMP方法使用一种预测误差方法包括依次对每个变量进行“noising-up”。 由于VIMP是排列前后OOB预测误差的差异VIMP值表示错误指定会降低森林中的预测准确性。VIMP接近零表示该变量对预测准确性没有任何贡献并且负值表示当变量被错误指定时预测精度提高。 plot(gg_vimp(rfsrc_pbc)) theme(legend.position c(0.8, 0.2)) labs(fill VIMP 0)本期先介绍到这里未完待续。
http://www.dnsts.com.cn/news/276933.html

相关文章:

  • 高端网站开发企业庆阳网站建设公司
  • 周村网站建设手机室内设计软件app
  • 高端h5网站建设 上海政务网站建设存在问题
  • 南山商城网站建设找哪家公司比较安全wordpress演示站
  • 湖北工程建设总承包有限公司网站深圳seo优化关键词排名
  • 网站主题切换页面设计ui
  • 南阳卧龙区网站建设哪家好网站建设的流程和内容
  • 在网站上如何做天气预报栏wordpress 百度 tag
  • 汕头电商网站建设金汇网站建设
  • 商业网站源码免费下载国家高新技术企业认定机构
  • 教育网站制作软件wordpress参数传递的函数
  • 网站商城服务体系建设方案排名做网站优化
  • 江西核工业建设有限公司网站页面设计排版
  • 现在网站给源码咖啡厅网站建设
  • 网站大屏轮播图效果怎么做网站建设买什么书
  • 网站建设能否建立国外站网站建设都需要哪些资质
  • 江宁城乡建设局网站网站结构方面主要做哪些优化
  • 新吁网站建设新闻类的网站如何做优化、
  • 30岁做网站编辑商务网站建设与维护 试题
  • 网站建设安全服务协议wordpress老站开启多站点
  • 企业网站的建设与应用开题报告做设计哪个网站图比较实用
  • 个人网站的建设目标温州网页制作哪家好
  • 西安网站建设哪家好白山市城乡建设局网站
  • 做公司网站需做笑话网站赚钱
  • 外国炫酷网站设计河北百度seo
  • 企业网站建设及维护费用小程序个人开发全过程
  • 毛纱厂家东莞网站建设工商注册网上办事大厅
  • 专业建站推广服务网站建设总结材料
  • 行业数据分析网站排名优化关键词
  • 做一个中英文网站多少钱企业形象设计和品牌形象设计