当前位置: 首页 > news >正文

上海专业微信网站建设wordpress无头像昵称评论

上海专业微信网站建设,wordpress无头像昵称评论,搏彩网站开发建设,松江品划做网站文章目录 1 前言1.1 决策树的介绍1.2 决策树的应用 2 Scikit-learn数据集演示2.1 导入函数2.2 导入数据2.3 建模2.4 评估模型2.5 可视化决策树2.6 优化模型2.7 可视化优化模型 3 讨论 1 前言 1.1 决策树的介绍 决策树#xff08;Decision Tree#xff0c;DT#xff09;是一… 文章目录 1 前言1.1 决策树的介绍1.2 决策树的应用 2 Scikit-learn数据集演示2.1 导入函数2.2 导入数据2.3 建模2.4 评估模型2.5 可视化决策树2.6 优化模型2.7 可视化优化模型 3 讨论 1 前言 1.1 决策树的介绍 决策树Decision TreeDT是一种类似流程图的树形结构其中内部节点表示特征或属性分支表示决策规则每个叶节点表示结果。在决策树中最上方的节点称为根节点。它学习基于属性值进行分区。它以递归方式进行分区称为递归分区。这种类似流程图的结构有助于决策制定。它的可视化类似于流程图可以很容易地模拟人类的思维过程。这就是为什么决策树易于理解和解释的原因。 决策树的时间复杂度是给定数据中记录和属性数量的函数。决策树是一种无分布或非参数方法不依赖于概率分布假设。决策树可以很好地处理高维数据。 其原理可简单分为三步**选择最优划分属性**根据信息增益、信息增益比、基尼指数等方法选择当前数据集中最优的属性作为划分属性将数据集分成多个子集。**递归生成子树**对每个子集重复步骤1递归生成子树直到所有的叶子节点都属于同一类别。**剪枝**为了防止过拟合需要对决策树进行剪枝即去除一些分支或子树使决策树更加简洁。 优点 易于理解和解释DT算法可以生成易于理解和解释的决策树模型因此非专业人员也可以理解和使用该算法。 可解释性和可视化DT算法可以通过绘制决策树的形式来直观地呈现分类过程增强了模型的可解释性和可视化性。 适用性广泛DT算法可以处理离散和连续型特征且对数据的分布和噪声鲁棒性较高。 缺点 容易过拟合DT算法在训练集上可能表现得很好但在测试集上表现得很差容易过拟合。 对噪声和异常值比较敏感DT算法对噪声和异常值比较敏感容易导致生成的决策树过于复杂。 不支持在线学习DT算法需要一次性加载所有的数据并在内存中进行操作因此不支持在线学习。 1.2 决策树的应用 决策树对于常规分类跟前面介绍的五种分类器其实差别不大不过鉴于其易理解易运用对于实际生活还是有着不少便利。 金融风险评估决策树可以用于预测借款人的还款能力和信用等级帮助金融机构决定是否批准贷款。 医疗诊断决策树可以用于帮助医生诊断疾病或推荐治疗方案根据患者的症状和医疗历史进行分类。 客户关系管理决策树可以用于客户细分根据客户的购买历史、偏好和行为预测客户的需求帮助企业定制个性化的服务。 电子商务决策树可以用于商品推荐根据用户的历史购买记录和行为推荐符合用户偏好的商品。 生产优化决策树可以用于优化生产过程根据生产线上的各种因素例如温度、湿度、时间等来决定何时停机、何时更换部件从而减少故障和损失。 人力资源管理决策树可以用于招聘、晋升和培训决策根据员工的学历、工作经验、业绩等因素预测员工的发展潜力和能力从而做出更加科学的决策。 2 Scikit-learn数据集演示 2.1 导入函数 import pandas as pd from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split from sklearn import metrics 2.2 导入数据 先下载这个糖尿病数据集https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database 注册或者用google登陆一下download即可若下载失败或者登不上去的可后台回复0420领取示例数据集 然后导入数据这里用了小写表头所以headerNone然后再将首行定义为列名若参考网上其他教程留意库和函数的更新更改否则可能会报错 col_names [pregnant, glucose, bp, skin, insulin, bmi, pedigree, age, label] pima pd.read_csv(diabetes.csv, headerNone, namescol_names) pima pima.iloc[1:] pima.head()2.3 建模 这里定义自变量和因变量然后分组 feature_cols [pregnant, insulin, bmi, age,glucose,bp,pedigree] X pima[feature_cols] # Features y pima.label # Target variable# 训练集测试集7/3分 X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.3, random_state1)建立决策树 clf DecisionTreeClassifier() clf clf.fit(X_train,y_train) y_pred clf.predict(X_test) 2.4 评估模型 print(Accuracy:,metrics.accuracy_score(y_test, y_pred))结果能达到69.697%还是可以的 2.5 可视化决策树 这两个包先下载了且检查路径没问题 #!pip install graphviz #!pip install pydotplus可视化 from sklearn.tree import export_graphviz from six import StringIO from IPython.display import Image import pydotplus dot_data StringIO() export_graphviz(clf, out_filedot_data, filledTrue, roundedTrue,special_charactersTrue,feature_names feature_cols,class_names[0,1]) graph pydotplus.graph_from_dot_data(dot_data.getvalue()) graph.write_png(diabetes.png) Image(graph.create_png())这是原始的分类每个内部节点都有一个拆分数据的决策规则称为基尼系数测量节点的杂质因此获取更准确的结果需要进行优化。 2.6 优化模型 criterion: 可选参数默认为“gini”或选择属性选择度量。该参数允许我们使用不同的属性选择度量。支持的标准是“gini”用于Gini指数以及“entropy”用于信息增益。 splitter: 字符串可选参数默认为“best”或分割策略。该参数允许我们选择分割策略。支持的策略有“best”选择最佳分割和“random”选择最佳随机分割。 max_depth: 整数或None可选参数默认为None或树的最大深度。树的最大深度。如果为None则节点会扩展直到所有叶子节点包含的样本数少于min_samples_split。最大深度的值过高会导致过拟合而过低的值会导致欠拟合。 这里选择max_depth3也可以换成其他预修剪 clf DecisionTreeClassifier(criterionentropy, max_depth3) clf clf.fit(X_train,y_train) y_pred clf.predict(X_test) print(Accuracy:,metrics.accuracy_score(y_test, y_pred))分类率变成了77.056%效果可观 2.7 可视化优化模型 from six import StringIO from IPython.display import Image from sklearn.tree import export_graphviz import pydotplus dot_data StringIO() export_graphviz(clf, out_filedot_data, filledTrue, roundedTrue,special_charactersTrue, feature_names feature_cols,class_names[0,1]) graph pydotplus.graph_from_dot_data(dot_data.getvalue()) graph.write_png(diabetes.png) Image(graph.create_png())确实结果比优化前的更简洁了分类后的复杂程度大大降低了。 3 讨论 Python中的决策树是机器学习数据科学的重要子集领域非常流行的监督学习算法技术但是决策树并不是可用于提取此信息的唯一聚类技术。 它是一种监督式机器学习技术其中数据根据某个参数连续拆分。决策树分析可以帮助解决分类和回归问题这里只演示了分类。决策树算法将数据集分解为更小的子集;同时相关的决策树是逐步开发的。决策树由节点测试某个属性的值、边/分支对应于测试结果并连接到下一个节点或叶和叶节点预测结果的终端节点组成使其成为一个完整的结构。
http://www.dnsts.com.cn/news/104812.html

相关文章:

  • 做网站怎么选择服务器中铁建设集团集网登录
  • asp网站编辑教程温州网站制作公司
  • 营销型网站制作步骤五个百度导航下载2021最新版
  • 门户网站建设 请示手机wap网站cms源码
  • 贸易网站模板erp系统有哪些功能模块
  • 中国建设银行网站下载cg资源网
  • 厦门国外网站建设公司排名青海公路建设信用信息服务网站
  • 网站建设与优化推广的话术o2o网站建设最好公司
  • 简单的美食网站模板免费下载怎么做链接网站
  • 南安市网站建设青岛网站seo
  • 免费手机网站平台注册饮食网站开发需求
  • 如果在工商局网站上做股权质押如何在网站上做社交的链接
  • 做阿里巴巴类似的网站网站后台如何上传ico图标
  • 做个网站需要什么设备技术培训ui设计
  • 网站搭建教学网那个网站教你做毕设的
  • 青海省建设厅职业注册官方网站阳江房产网二手房出售
  • 江苏响应式网站建设哪里有seo厂商
  • 公司网站建设业务文案福建省建设工程信息网站
  • 网站如何换空间wordpress移动端分享插件
  • 移动端网站建设服务商学什么可以做网站
  • 购物网站开发历史湖南环达公路桥梁建设总公司网站
  • 网站wordpress是什么主流门户网站有哪些
  • asp 企业网站关键词优化排名平台
  • 广州网站设计公司排名网站建设的广告语
  • 百度网站链接提交安徽建设工程信息平台
  • 织梦手机网站怎么做征婚网站上拉业务做恒指期货
  • 做外卖有哪些网站德宏企业网站建设
  • canvas做的手机网站网站建设合同需要交印花税
  • 手工艺品网站建设目的网站域名空间管理
  • 网站建设基本流程pptwordpress免费资讯主题