当前位置: 首页 > news >正文

虹口北京网站建设微信是什么公司开发的

虹口北京网站建设,微信是什么公司开发的,宿迁网站,做外贸学英语的网站DataWhale 机器学习夏令营第三期 学习记录二 (2023.08.23)——可视化分析1.赛题理解2. 数据可视化分析2.1 用户维度特征分布分析2.2 时间特征分布分析 DataWhale 机器学习夏令营第三期 ——用户新增预测挑战赛 学习记录二 (2023.08.23)——可视化分析 2023.08.17 已跑通baseli… DataWhale 机器学习夏令营第三期 学习记录二 (2023.08.23)——可视化分析1.赛题理解2. 数据可视化分析2.1 用户维度特征分布分析2.2 时间特征分布分析 DataWhale 机器学习夏令营第三期 ——用户新增预测挑战赛 学习记录二 (2023.08.23)——可视化分析 2023.08.17 已跑通baseline换为lightgbm基线不加任何特征线上得分0.52214 添加baseline特征线上得分0.78176 暴力衍生特征并微调模型参数线上得分0.86068 2023.08.23 数据分析、衍生特征0.87488 衍生特征、模型调参0.89817 交流分享视频 【DataWhale“用户新增预测挑战赛”交流分享-哔哩哔哩】 https://b23.tv/zZMLtFG 1.赛题理解 这次比赛特征主要可以分为以下三个维度 行为维度eid、udmap udmap的key处理成了类别特征 时间维度common_ts 进行了时间戳特征的提取day, hour, minute 用户维度x1~x8 2. 数据可视化分析 使用以下代码绘制前还需做一些设置具体可以参考如下链接 https://www.kaggle.com/code/jcaliz/ps-s03e02-a-complete-eda/notebook 该notebook内提供了丰富的可视化分析代码和思路值得参考。 绘制代码 def plot_cate_large(col):data_to_plot (all_df.groupby(set)[col].value_counts(True)*100)fig, ax plt.subplots(figsize(10, 6))sns.barplot(datadata_to_plot.rename(Percent).reset_index(),hueset, xcol, yPercent, axax,orientv,hue_order[train, test])x_ticklabels [x.get_text() for x in ax.get_xticklabels()]# Secondary axis to show mean of targetax2 ax.twinx()scatter_data all_df.groupby(col)[target].mean()scatter_data.index scatter_data.index.astype(str)ax2.plot(x_ticklabels,scatter_data.loc[x_ticklabels],linestyle, marker., colorcolors[4],markersize15)ax2.set_ylim([0, 1])# Set x-axis tick labels every 5th valuex_ticks_indices range(0, len(x_ticklabels), 5)ax.set_xticks(x_ticks_indices)ax.set_xticklabels(x_ticklabels[::5], rotation45, haright)# titlesax.set_title(f{col})ax.set_ylabel(Percent)ax.set_xlabel(col)# remove axes to show only one at the endhandles []labels []if ax.get_legend() is not None:handles ax.get_legend().legendHandleslabels [x.get_text() for x in ax.get_legend().get_texts()]else:handles ax.get_legend_handles_labels()[0]labels ax.get_legend_handles_labels()[1]ax.legend().remove()plt.legend(handles, labels, locupper center, bbox_to_anchor(0.5, 1.08), fontsize12)plt.tight_layout()plt.show() 2.1 用户维度特征分布分析 可视化分析说明 研究离散变量[eid, x3, x4, x5‘,x1, x2, x6,x7, x8]的分布蓝色是训练集黄色是验证集分布基本一致粉色的点是训练集下每个类别每种取值的target的均值也就是target1的占比 该图主要分析类别数较少的离散变量 训练集和测试集分布比较均匀x1主要集中在 x14 x2分布比较均匀x6基本集中在1和4两个值x7分布比较均匀可能是一个关键特征x8可能是性别特征特征重要性较低udmap_key为提取出的特征存在缺失值 x3主要集中在41下占比太大特征重要性很低 x4中各个类别下target的分布变化较大可能是一个关键特征 x5中各个类别同x4,target的分布变化较大可能是一个关键特征但特征数量太多在衍生特征时需要注意避免产生稀疏性 2.2 时间特征分布分析 主要绘制了common_ts中 day 和 hour 的变化情况 day的值和用户增长有很大的关系可以发现在10、14和17新用户有明显的增长老用户对应也呈现出增长趋势 绘制了从day10到day18的新老用户变化情况新老用户的数量在每天的各个时间段呈现基本相同的趋势进一步观察原始数据可以发现三个峰的出现是因为在该三个时间段数据量较其他时间段多可以进一步绘制出各个时间段人数占全天人数的占比图来进一步分析数据
http://www.dnsts.com.cn/news/121167.html

相关文章:

  • 宝塔如何添加ip域名做网站赣州微和联网络科技有限公司
  • asp网站程序微信页面设计网站
  • 男女情感类网站软件技术职业
  • 贵阳门户网站wordpress博客增加音乐页面
  • 为网站添加isapi扩展清理大师
  • 苏州网站制作设计网站上传根目录
  • 专业电子网站建设如何下载海外app
  • 如何用自己电脑做网站东莞室内设计公司
  • 长沙3合1网站建设网站qq链接怎么做
  • 网站美工建设软件网站加地图
  • 山东环保行业网站开发十大全app软件下载
  • 动态域名可以做网站吗一个网站后台怎么做
  • 哪个网站可以做旅行攻略wordpress 空间 域名
  • 网站推广的意义云南网络营销seo
  • 酷网站欣赏惠阳惠州网站建设
  • 网站开发成本如何入账在哪个网站上可以学做衣服
  • 兰山区住房和城乡建设局网站外链
  • 东风地区网站建设价格杭州做网站建设公司
  • 淘客怎样做自己的网站网站建设 客户评价
  • 网站和app区别与联系wordpress迁移修改域名
  • 网站仿制教程跨境电商平台排行榜
  • 网站开发平台是什么做去态网站要学什么语言
  • 湖南省城乡和住房建设厅网站网站建设网址网站制作
  • 电脑课要求的网站怎么做怎样注册小程序商城
  • 大庆网站建设公司哪家好做简历用的网站
  • 网站设计的市场分析淘宝客做连接网站吗
  • 制作一般网站wordpress企业宣传电商
  • 便宜高端网站设计网站上传发生一个ftp错误
  • 上海房地产网站建设私人网站建设步骤
  • 模板下载免费权威网站优化价格