当前位置: 首页 > news >正文

网站策划论坛平台推广方式有哪些

网站策划论坛,平台推广方式有哪些,哪个做网站公司好,宁波外贸seo网站建设1.实战内容 (1) 加载鸢尾花数据集(iris.txt)并存到iris_df中,使用seaborn.lmplot寻找class#xff08;种类#xff09;项中的异常值#xff0c;其他异常值也同时处理 。 import pandas as pd from sklearn.datasets import load_iris pd.set_option(display.max_columns, N…1.实战内容 (1) 加载鸢尾花数据集(iris.txt)并存到iris_df中,使用seaborn.lmplot寻找class种类项中的异常值其他异常值也同时处理 。 import pandas as pd from sklearn.datasets import load_iris pd.set_option(display.max_columns, None) pd.set_option(display.max_rows, None) irisload_iris() iris_df pd.DataFrame(iris[data], columnsiris[feature_names]) iris_df[target]iris[target] import pandas as pd import matplotlib.pyplot as plt iris_dfpd.read_csv(iris.txt,sep,) iris_df import seaborn as snsimport warnings warnings.filterwarnings(ignore)sns.lmplot(xsepal_length,ysepal_width,colclass,datairis_df) sns.lmplot(xpetal_length,ypetal_width,colclass,datairis_df) iris_df[class].drop_duplicates()#通过上面的语句发现class中有异常值同时发现sepal_width和sepal_length有异常值#class应为3类将versicolor修改为Iris-versicolor,将iris-setossa修改为Iris-setosa iris_df.loc[iris_df[class]versicolor,class]Iris-versicolor iris_df.loc[iris_df[class]Iris-setossa,class]Iris-setosa sns.lmplot(xsepal_length,ysepal_width,colclass,datairis_df)#重画,检验是否是3类 #通过直方图观察数据分布 iris_df.loc[iris_df[class]Iris-setosa,sepal_width].hist() # 将Iris-setosa的sepal_width小于2.5cm删除 iris_dfiris_df.loc[(iris_df[class]!Iris-setosa)|(iris_df[sepal_width]2.5)] iris_df.loc[iris_df[class]Iris-setosa,sepal_width].hist() #列出异常值 iris_df.loc[(iris_df[class]Iris-versicolor)(iris_df[sepal_length]1.0)] # 将Iris-versicolor的sepal_length接近于0的异常值乘100‘米’转化成‘厘米’ iris_df.loc[(iris_df[class]Iris-versicolor)(iris_df[sepal_length]1.0),sepal_length]* 100 iris_df.loc[iris_df[class]Iris-versicolor,sepal_length].hist() (2) 使用isnull和describe查看缺失值并处理  # 列出缺失的样本 iris_df.isnull().sum() iris_df.describe() iris_df.loc[iris_df[petal_width].isnull()]#用该类的平均值来填补缺失值并列出修改过样本 avg_valueiris_df.loc[iris_df[class]Iris-setosa,petal_width].mean() iris_df.loc[(iris_df[class]Iris-setosa)(iris_df[petal_width].isnull()), petal_width] avg_value iris_df.loc[(iris_df[class]Iris-setosa)(iris_df[petal_width]avg_value)] #检查是否还存在缺失值 iris_df.isnull().sum() #将标签名称转化成标签(如Iris-setosa变成0) class_mapping{Iris-setosa:0,Iris-versicolor:1,Iris-virginica:2} iris_df[class]iris_df[class].map(class_mapping) iris_df #保存数据 iris_df.to_csv(iris-clean.csv,indexFalse) (3) 导入sklearn自带的数据集load_iris,获取特征矩阵和目标数组标签 from sklearn.datasets import load_iris irisload_iris() iris_Xiris.data iris_Yiris.target (4) 使用KNeighborsClassifier()分类预测  from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import train_test_split,cross_val_score def knn_function(X,Y):X_train,X_test,Y_train,Y_testtrain_test_split(X,Y,test_size0.3)clfKNeighborsClassifier()#建立模型clf.fit(X_train,Y_train)#训练模型predict_testclf.predict(X_test)print(预测的值,\n,predict_test)print(真实的值,\n,Y_test)scoreclf.score(X_test,Y_test,sample_weightNone)#计算准确率print(准确率,\n,score)return clf knn_function(iris_X,iris_Y) (5) 导入iris_clean.csv,获取特征矩阵和目标数组调用函数knn_function()保存模型  import pandas as pd import pickle import seaborn as sns import matplotlib.pyplot as plt iris pd.read_csv(iris-clean.csv) #获取特征矩阵和目标数组标签 iris_XX iris.loc[0:,sepal_length:petal_width].values iris_YY iris[class].values #调用函数 knn_model knn_function(iris_XX,iris_YY) # 保存模型 with open(knn_model.pkl, wb) as f:pickle.dump(knn_model, f) # 读取保存模型 with open(knn_model.pkl, rb) as f:model pickle.load(f) #模型的表现与训练集的选择关系 model_accuracies [] for repetition in range(1000):X_train, X_test, Y_train, Y_test \train_test_split(iris_XX, iris_YY, test_size0.3) # 通过读取保存模型knn_model.pkl代码,建立模型modelscore model.score(X_test, Y_test, sample_weightNone)model_accuracies.append(score) sns.distplot(model_accuracies) plt.show() (6) 超参数与调整以sklearn自带的鸢尾花数据为例选择KNN模型调整超参数K的值用10折交叉验证判断K值为1~25时的最优值  from sklearn.model_selection import train_test_split, cross_val_score from sklearn import datasets from sklearn.neighbors import KNeighborsClassifier import matplotlib.pyplot as pltiris datasets.load_iris() X iris.data Y iris.target # 划分训练集和测试集测试集占总数据的33%随机数生成器种子为10 X_train, X_test, Y_train, Y_test train_test_split(X, Y, test_size0.33,random_state10) k_range range(1, 26) cv_scores [] for n in k_range:clf KNeighborsClassifier(n)scores cross_val_score(clf, X_train, Y_train, cv10,scoringaccuracy) cv_scores.append(scores.mean()) plt.plot(k_range, cv_scores) plt.xlabel(K) plt.ylabel(Accuracy) plt.show()#选择最优的k best_clf KNeighborsClassifier(n_neighbors5) best_clf.fit(X_train, Y_train) print(参数,best_clf.get_params()) print(准确率,best_clf.score(X_test, Y_test)) print(预测的值,best_clf.predict(X_test))2.数据集下载 https://gitee.com/qxh200000/c_-code/commit/1af2468e6b7f1bd8cd3b890018031c6fa6dff9bd
http://www.dnsts.com.cn/news/238801.html

相关文章:

  • 网站轮播图济南代做标书网站标志
  • net 网站开发泉州网站建设公司
  • 兰州医院网站制作企业+php网站建设
  • 商城网站合作协议微营销是什么
  • 网站服务器服务商软件开发项目技术方案
  • 高端网站建设专家评价吴忠市住房和城乡建设局网站
  • 有哪里可以做兼职翻译的网站wordpress 时间函数
  • 外贸定制网站闸北网站优化公司
  • 网站后台管理权限设计设计基础网站推荐
  • 汉中公司做网站公司网站后台
  • 余姚厂家高端网站设计免费咨询英文
  • 如何查询某个网站的设计公司虚拟网站建设
  • 自己做的网站别人打不开牟平建设局网站北留德庄
  • 网址关键词查询网站新建网站注意事项
  • 朝阳区网站建设公司施工企业降本增效的方法和措施
  • 河北城乡建设部网站首页深圳公司排名前十名
  • 学校门户网站建设管理办法建设设计公司网站
  • html5微网站济南市建设网站
  • 建站素材wordpress周期
  • 网站的登录注册怎么做网页游戏网页游戏大全
  • 网站建设费用兴田德润团队域名所有人是网站名不能转出
  • 网站架设流程牟平建设局网站北留德庄
  • 网站建设wang1314雅安市建设网站
  • seo做网站兰州最新大事
  • 网站浮动广告代码wordpress手机端网站
  • 做网站是用ps还是ai关于网站开发制作的相关科技杂志的网站
  • 保险代理人做网站南通网站建设推广专家
  • 专门做房产的网站亳州是网站建设
  • wordpress编辑和作者的权限区别深圳seo推广培训
  • 公司网站做优化少钱python网站开发基础