当前位置: 首页 > news >正文

银川网站开发制作济南网站建设 联系小七

银川网站开发制作,济南网站建设 联系小七,wordpress网页中添加3个音乐播放,苏州好的做网站的公司哪家好一、分析目的和数据集描述 要分析的数据是美国一区域的保险费支出的历史数据。保险费用数据表的每列分别为年龄、性别、体重指数、孩子数量、是否吸烟、所在区域、保险收费。 本文的主要目的是分析在年龄、性别、体重指数、孩子数量、是否吸烟、所在区域中这些因素中#xf…一、分析目的和数据集描述 要分析的数据是美国一区域的保险费支出的历史数据。保险费用数据表的每列分别为年龄、性别、体重指数、孩子数量、是否吸烟、所在区域、保险收费。 本文的主要目的是分析在年龄、性别、体重指数、孩子数量、是否吸烟、所在区域中这些因素中哪些因素对保险费支出影响最大这些因素中哪些因素与保险费用的关联最大。 分析影响保险费支出的具体因素本文用到了R语言的数据挖掘-关联规则挖掘Apriori算法。 具体使用和详细用法如下 二、导入数据集 df-read.csv(f:/桌面/insurance.csv) head(df) head(df)age sex bmi children smoker region charges 1 19 female 27.90 0 yes southwest 16885 2 18 male 33.77 1 no southeast 1726 3 28 male 33.00 3 no southeast 4449 4 33 male 22.70 0 no northwest 21984 5 32 male 28.88 0 no northwest 3867 6 31 female 25.74 0 no southeast 3757 三、导入关联规则挖掘用到的分析程序包 library(arules)    #用于数据关联规则挖掘 library(arulesViz)    #关联规则挖掘的可视化程序包 library(dplyr)    #用于数据处理的分析包我们将使用里面的管道函数%% library(ggplot2)   四、查看数据集 summary(df)查看体重指数的分布情况使用直方图 ggplot(df,aes(xbmi))   geom_histogram(binwidth5,filllightblue,colourblack) 因为要分析的数据集无缺失值下一步就是要对数据各变量转换为因子型也是是规则关联函数 apriori()要求的。 五、将数据集的变量转换为因子型 df-df %% mutate(ageas.factor(cut(age,breaks c(0,25,50,75,100)))) %%    mutate(sexas.factor(sex)) %% mutate(bmias.factor(cut(bmi,breaks c(0,15,30,45,60,75)))) %%   mutate(childrenas.factor(children)) %% mutate(smokeras.factor(smoker)) %%   mutate(regionas.factor(region)) %% mutate(chargesas.factor(cut(charges,breaks c(0,13000,26000,39000,65000)))) 在这里用到了管道函数对年龄、健康指数、保险费用按区间分组把年龄分为4组健康指数分为5组保险费支出分为了4组然后对分组后的变量使用as.factor()转换为因子型变量。 六、对保险费用数据集进行关联分析 rules-apriori(df,parameter list(supp0.1,conf0.8)) summary(rules) 运行得到了各规则的描述性统计量共生成了80条规则。支持度为0.1置信度为0.8. 查看关联分析结果 options(digits4) inspect(head(rules,bylift)) 运行得到了按提升值排序后的6条规则。 例如第一条年龄在0到25岁之间无小孩不吸烟的家庭关联最低程度的保险费用支出的支持度为0.1121置信度94.34%。 关联规则分析可视化 plot(rules) 七、指定后项集的关联挖掘分析 1、后项集指定为保险费用支出charges(39000,65000],即分析关联最高级别的保险费用支出的影响因素有哪些。 rules_rhs_highrank-apriori(df,parameter list(supp0.02,conf0.5),         appearance list(rhsc(charges(3.9e04,6.5e04])),controllist(verboseF)) inspect(head(rules_rhs_highrank,bylift)) 查看分析结果 从运行结果可以看到年龄较大体重较重吸烟等因素与保险费用支出较高支持相关联。 inspect(head(rules_rhs_highrank[!is.redundant(rules_rhs_highrank)],bylift)) 去除规则冗余后的结果如下 2、后项集指定为保险费用支出charges(0,13000],即分析关联最低级别的保险费用支出的影响因素有哪些。 rules_rhs_lowrank-apriori(df,parameter list(supp0.1,conf0.5),              appearance list(rhsc(charges(0,1.3e04])),controllist(verboseF)) inspect(head(rules_rhs_lowrank,bylift)) 运行得到 从结果可以看到年龄较小无孩子不吸烟是女性的保险费用支出较少。
http://www.dnsts.com.cn/news/30730.html

相关文章:

  • 博客建站程序网页版qq邮箱登陆登录入口
  • 最便宜的酒店网站建设办公oa系统排行
  • 东莞网站设计报价站长工具ip地址查询
  • 网站免费推广方式陕西建设技术学院网站
  • 互联网网站 权限代理小程序怎么赚钱
  • 山东专业网站建设网站项目的工作流程
  • 建网站的八个步骤深圳福田最新消息今天
  • 鞍山市做网站公司衡水建站公司
  • 自己做的网站怎么传入外网网页制作教程免费下载
  • 潍坊市奎文建设局网站河北网站建设seo优化营销制作设计
  • 购物网站排名2015有什么好的免费网站做教育宣传
  • 做网站的 简历顺飞网站建设怎么样
  • 网站建设公司做网站需要注意什么网站模版免费下载
  • 台州自助建站在线咨询网站开发内容和方法
  • 河南高端网站高端网站建设做全景哪个网站不模糊
  • 风铃网站具体是做那方面的网站建设公司挣钱吗
  • 南昌网站建设信息电脑和手机同步编辑wordpress
  • 备案主体负责人和网站负责人辽宁建设工程信息网官方网站
  • 广西智能网站建设方案深圳能源集团股份有限公司
  • 嘉鱼网站建设前十未央微网站建设
  • 做网站上传的图片显示变形阿里巴巴建设网站首页
  • 做网站广告公司联系方式怎么建立一个网站域名
  • 网站详情页用哪个软件做大连做网站价格
  • 网站服务器建设合同范本红色主题展馆设计
  • 商城网站具体需求教人做素食的网站
  • 重庆长寿网站设计公司哪家专业怎么建设网站网页游戏
  • 天猫商城网站设计分析上海浦东做网站
  • 广州外贸网站建设龙游网站建设的公司
  • 南京页面网站制作wordpress怎么切换中文字体
  • 定制网站建设的书籍全网营销推广 好做吗