当前位置: 首页 > news >正文

怎么做网络乞丐网站网校网站建设多少钱

怎么做网络乞丐网站,网校网站建设多少钱,分销网络设计案例,91关键词排名机器学习实验报告#xff1a;决策树与随机森林数据分类 实验背景与目的 在机器学习领域#xff0c;决策树和随机森林是两种常用的分类算法。决策树以其直观的树形结构和易于理解的特点被广泛应用于分类问题。随机森林则是一种集成学习算法#xff0c;通过构建多个决策树并…机器学习实验报告决策树与随机森林数据分类 实验背景与目的 在机器学习领域决策树和随机森林是两种常用的分类算法。决策树以其直观的树形结构和易于理解的特点被广泛应用于分类问题。随机森林则是一种集成学习算法通过构建多个决策树并进行投票以提高分类的准确性和鲁棒性。本实验的目的在于让学生通过实践深入理解这两种算法的工作原理掌握使用Python的sklearn库对数据进行分类的方法并熟悉数据预处理的相关技术。 数据集 关注公众号码银学编程回复income_classification。 income_classification实验环境配置 实验在配置较高的个人计算机上进行具体配置如下 开发工具PyCharm 2021.3.1操作系统Windows 11处理器Intel® Core™ i5-10210U CPU 1.60GHz 2.11 GHz内存16.0 GB (15.8 GB 可用)系统类型64 位操作系统基于 x64 的处理器 实验内容与过程 实验内容主要围绕使用决策树和随机森林算法对收入水平数据集income_classification.csv进行分类。具体步骤如下 实验步骤1数据载入与展示 首先实验从载入数据集开始。使用pandas库的read_csv函数读取数据集并使用shape属性获取数据集的维度即行数和列数以及使用head()函数展示前5行数据。 实验步骤2数据离散化处理 对于连续变量age实验采用分位数的方法进行离散化处理。pd.qcut函数根据数据的分布将age分为5个区间每个区间的数据被赋予一个从0开始的整数标签。 实验步骤3特征编码 对于分类特征实验使用LabelEncoder进行编码将每个类别的字符串标签转换为整数。这一步骤是必要的因为机器学习模型只能处理数值型数据。 实验步骤4数据预处理及构造标签 接下来实验对数据进行预处理构造模型的输入数据和标签。数据集中的income字段被用作标签根据其值将标签分为0和1两类。 实验步骤5转换字符串数据类型为数值型 由于决策树和随机森林算法只能处理数值型数据实验使用DictVectorizer将数据转换为数值型。 实验步骤6训练集与测试集拆分 实验将数据集按照7:3的比例随机划分为训练集和测试集以便于后续的训练和测试。 实验步骤7CART决策树分类 使用CART算法训练决策树分类器并计算其在测试集上的分类准确率。 实验步骤8随机森林分类 使用随机森林算法训练分类器并同样计算其在测试集上的分类准确率。 实验步骤9结果可视化 最后实验通过柱状图可视化了两种模型的分类准确率直观展示了随机森林相对于决策树在本次实验中的优势。 实验结果 实验结果显示CART决策树的分类准确率为82.61%而随机森林的分类准确率达到了84.83%后者在本次实验中表现更优。 结果分析 决策树的生成是基于递归分裂过程每一次分裂都旨在最大化类别的同质性。然而决策树容易过拟合特别是当数据集未经过适当的离散化处理时。随机森林通过构建多个决策树并进行投票有效地提高了分类的准确性和鲁棒性。在本次实验中随机森林的准确率超过了决策树这可能是因为随机森林在处理复杂的分类问题时能够更好地泛化。 整体代码分析 以下是实验中使用的关键代码的详细分析 # 导入所需库 import numpy as np import pandas as pd from sklearn import tree from sklearn.ensemble import RandomForestClassifier from sklearn.feature_extraction import DictVectorizer from sklearn.preprocessing import LabelEncoder import matplotlib.pyplot as plt# 1. 载入数据 print(1、载入数据) data pd.read_csv(income_classification.csv, header0) print(数据维度, data.shape) print(data.head())# 2. 对连续变量 age 进行离散化处理 print(\n2、对年龄进行离散化处理) data[age] pd.qcut(data[age], q5, labelsFalse) # 使用分位数进行离散化 print(data.head())# 3. 将分类特征进行编码 print(\n3、对分类特征进行编码) class_le LabelEncoder() categorical_features [workclass,marital-status,occupation,education,native-country,relationship,race,sex] for feature in categorical_features:data[feature] class_le.fit_transform(data[feature]) print(data.head())# 4. 数据预处理及构造标签 print(4、构造数据和标签) data1 data.drop(income, axis1).to_dict(orientrecords) labels np.where(data[income] 50K, 0, 1)# 5. 转换字符串数据类型为数值型 print(5、转换字符串数据类型) vec DictVectorizer() x vec.fit_transform(data1).toarray()# 6. 拆分训练集与测试集 print(6、拆分训练数据和测试数据) ratio 0.7 indices np.random.permutation(len(x)) split_index int(ratio * len(indices)) x_train, x_test x[indices[:split_index]], x[indices[split_index:]] y_train, y_test labels[indices[:split_index]], labels[indices[split_index:]]# 7. CART决策树分类 print(7、CART决策树分类) clf_cart tree.DecisionTreeClassifier(criterionentropy) clf_cart.fit(x_train, y_train) accuracy_cart clf_cart.score(x_test, y_test) print(CART树分类准确率, accuracy_cart)# 8. 随机森林分类 print(8、随机森林分类) clf_random RandomForestClassifier() clf_random.fit(x_train, y_train) accuracy_random clf_random.score(x_test, y_test) print(随机森林分类准确率, accuracy_random)# 可视化分类准确率 models [CART, Random Forest] accuracies [accuracy_cart, accuracy_random]plt.figure(figsize(5, 5)) plt.bar(models, accuracies, color[blue, green]) plt.yticks(np.arange(0, 1, 0.05)) for i, v in enumerate(accuracies):plt.text(i, v max(accuracies) * 0.05, str(v), hacenter, vabottom) plt.title(Model Accuracies) plt.xlabel(Model) plt.ylabel(Accuracy Score) plt.show()在上述代码中首先导入了实验所需的库然后按步骤执行了数据载入、离散化处理、特征编码、数据预处理、模型训练和分类准确率计算。最后使用matplotlib库对分类准确率进行了可视化展示。
http://www.dnsts.com.cn/news/144205.html

相关文章:

  • 青海网站建设企业宁波易通宁波网站建设
  • 网站 系统概述郑州搜索引擎优化公司
  • 现在宁波做网站全国连锁装修公司
  • 机关网站建设和运行情况汇报wordpress网站建设教程
  • 客户管理系统网站wordpress开源可视化编辑
  • 如何做微信网站做广告wordpress 评论栏
  • 济南网络建站模板商务网站开发文档
  • 亚网互联网站设计云南省文山州网站建设
  • 珠海企业网站建设视频教做家常菜的网站
  • 易语言用电脑做网站服务器wordpress带样式备份
  • 中企动力双语网站城桥微信网站设计制作
  • 网站短期电脑培训班学费php网站开发指导教材 文献
  • 海洋网站建设怎么样做推广哪个平台好
  • 那个网站的系统好做dj音乐网站
  • asp.ney旅游信息网站下载 简洁外贸网站建设980
  • 邯郸市城乡住房建设局网站教育行业网站建设审批
  • 河南新蔡有做网站建设的吗seo网络推广哪家专业
  • 做镜像网站违法微企免费网站建设
  • 福州网站设计要多少钱自贡电子商务网站建设
  • 广州网站建设建网站流程的费用
  • 江苏扬州建设局网站天河建设网站公司
  • 绍兴建设局网站首页seo专业为网站建设
  • 开封景区网站建设项目方案企业信息查询系统官网广东
  • 做饰品一般用什么网站做首饰数据库 导入 wordpress 错误
  • 如何做网站的源码wordpress图片变形
  • 静态网站的好处就是安全性好从而怎样做号网站优化
  • 网站界面设计的原则工信部网站域名查询
  • 网站建设明细报价网站的静态页面
  • 查找网站域名网站建设易网
  • 建站快车的应用场景pc网站 手机网站 微信网站 上海