当前位置: 首页 > news >正文

直播视频网站建设百度推广销售员的工作内容

直播视频网站建设,百度推广销售员的工作内容,wordpress frames,怎么创建音乐网站【2023美赛】C题Wordle预测27页中文论文及Python详解 相关链接 #xff08;1#xff09;2023年美赛C题Wordle预测问题一建模及Python代码详细讲解 #xff08;2#xff09;2023年美赛C题Wordle预测问题二建模及Python代码详细讲解 #xff08;3#xff09;2023年美赛C题…【2023美赛】C题Wordle预测27页中文论文及Python详解 相关链接 12023年美赛C题Wordle预测问题一建模及Python代码详细讲解 22023年美赛C题Wordle预测问题二建模及Python代码详细讲解 32023年美赛C题Wordle预测问题三、四建模及Python代码详细讲解 42023年美赛C题Wordle预测问题25页论文 1 论文简介 1.1 问题一 通过解读问题其中需要解决两个问题第一小问为了对2023年3月1日的 Number of reported results进行预测并创建一个预测区间。这是一个时间序列预测问题本文建立机器学习模型进行时间序列数据回归预测。对于时间序列的回归预测线性回归模型需要满足线性、独立性、正态性、方差齐性、自变量间不存在多重共线、因变量为连续变量。所以首先要对数据进行数据分析查看数据的分布、异常值、是否存在季节性趋势和。正态分布检验是计算偏度(skewness)和峰度(kurtosis)。偏度能够反应分布的对称情况若以bs表示偏度。bs0称分布具有负偏离也称左偏态此时数据位于均值左边的比位于右边的少直观表现为左边的尾部相对于与右边的尾部要长因为有少数变量值很小使曲线左侧尾部拖得很长bs0称分布具有正偏离也称右偏态此时数据位于均值右边的比位于左边的少直观表现为右边的尾部相对于与左边的尾部要长因为有少数变量值很大使曲线右侧尾部拖得很长而bs接近0则可认为分布是对称的。是指反应的是图像的尖锐程度。峰度越大表现在图像上面是中心点越尖锐。峰度为0表示该总体数据分布与正态分布的陡缓程度相同峰度大于0表示该总体数据分布与正态分布相比较为陡峭为尖顶峰峰度小于0表示该总体数据分布与正态分布相比较为平坦为平顶峰。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。对于异常值可以采用以箱线图查看异常值的处理有填充法和删除样本的方法但在时间序列中优先考虑填充的方法填充的方法又向前填充、中位数填充、平均数填充以及众数填充。 其次需要进一步做特征工程特征工程是将原始数据转化成更好的表达问题本质的特征的过程使得将这些特征运用到预测模型中能提高对不可见数据的模型预测精度包括对时间特征进行信息提取、提取不同长度的滑动平均值、标准差等特征提高机器学习模型的拟合能力。在此基础上选择多种机器学习模型进行回归预测并可以通过K折验证来防止模型过拟合。最后预测阶段计算模型测试集误差将预测结果减去误差得到预测区间的最低值加上预测结果的误差得到预测区间的最高值。 第二小问需要分析单词的属性是否会影响困难模式下玩家得分的百分比。首先单词的属性有元音、辅音、字母序号、字母顺序、词性。将字母频率、字母序号、字母顺序、元音、辅音编码后分析与7种百分比的分析相关性可视化相关性得出结论。 1.2 问题二 通过解读问题其中需要解决两个问题第一小问需要在开发一个时间序列预测模型能够预测报告结果的分布即预测未来日期(1,2,3,4,5,6,X)的相关百分比。首先针对1-7种尝试建立7个回归模型特征工程部分包括提取百分比的数据特征包括滑动平均值、窗口标准差获取时间特征以及将字母频率、字母序号、字母顺序、元音、辅音编码行编码作为类别特征采用机器学习的回归模型进行预测7种情况的百分比。其次大部分特征可能存在多重共线性数据存在多重过线性会导模型容易过拟合或者导致模型无法解释。去除共线性特征的方法有画图法定性分析、相关法定量分析、方差膨胀系数分析、Principal Component Analysis (PCA)分析、相关法迭代分析。然后将数据标准化后才能将数据作为训练集和测试用来训练和测试模型。回归模型有线性回归、多项式回归、逐步回归、岭回归、Boost模型XGBoost和融合模型LightGBM回归。最后题目中要求评价模型的性能可以采用多重误差评价方法包括均方误差Mean Squared ErrorMSE均方根误差Root Mean Squard ErrorRMSE以及平均绝对误差Mean Absolute ErrorMAE。 1.3 问题三 题目中要求建立一个模型对单词进行分类我们采用机器学习中的聚类方法对单词进行编码后采用K-Means(K均值)聚类、均值漂移聚类、基于密度的聚类方法(DBSCAN)、层级聚类算法、EM聚类或者图团体检测(Graph Community Detection)将单词难度分为三类或者更多如困难、一般、简单。然后对每一类的单词可视化分析并描述数据得出结论。并分析EERIE的类别以轮廓系数等评价方式评价聚类效果的好坏。 2 下载方式 betterbench.top/#/45/detail
http://www.dnsts.com.cn/news/211249.html

相关文章:

  • 自定义网站建设外贸尾单t恤
  • 网站制作原理廊坊网站建设团队
  • 只做衬衣网站施工企业会计科目表
  • flash代码做网站教程爱站库
  • 网站开发设计制作合同单页网站有后台
  • 无锡手机网站制作费用房屋装修设计软件哪个好用
  • 邢台做网站公司排名无锡制作网站公司哪家好
  • 购物商城网站建设多少钱成都网站建设模板制作
  • 哪个网站做自媒体比较好建设银行手机银行网站用户名是什么意思
  • 企业 北京 响应式网站微信分销网站建设比较好
  • 做蛋糕网站的优点wordpress分页调用代码
  • 网站前台模块包括什么广州专业找人见人付款
  • 网站添加在线支付功能制作网页的基本技术标准
  • 衡水网站建设维护邢台路桥建设总公司没有网站吗
  • 新塘做网站公司网页版梦幻西游是网易的吗
  • 宿迁市建设局投诉网站网络营销常用的方法有哪些
  • 做外墙资料的网站龙湖地产 网站建设
  • 游戏网站建设免费免费网站空间 推荐
  • 网站建设需要什么插件线下推广渠道
  • 苏州网站开发建设制作wordpress阿里图标库
  • 网站后台制作步骤中国菲律宾友谊
  • 湖南湘潭网站建设自媒体有哪些平台
  • 深圳市福田建设局网站襄阳做网站比较有实力的公司
  • 游戏网站推广室内设计项目概况
  • 绍兴网站关键词推广专业网站设计公司排名
  • 中石油网页设计与网站建设世界500强企业标准
  • ppt网站建设比较公司网站与营销网站的不同
  • 西安网站建设seo惠州营销网站建设
  • 免费发做网站久久建筑网的文件是免费下载吗
  • vs做的网站图片显示不了保定软件开发公司