当前位置: 首页 > news >正文

关于政府网站建设的研究报告培训学校管理制度大全

关于政府网站建设的研究报告,培训学校管理制度大全,做网站需要的法律知识,河北省网站建设公司#1.数据倾斜 什么是数据倾斜#xff1f; 一部分数据多 一部分数据少 造成的结果#xff1a; MR运行过慢 主要是shuffle和reduce过程慢 分组聚合导致数据倾斜 Hive未优化的分组聚合 方法1#xff1a;在MAP端直接聚合#xff08;分组聚合优化#xff09;#xff0c;减少…#1.数据倾斜 什么是数据倾斜 一部分数据多 一部分数据少 造成的结果 MR运行过慢 主要是shuffle和reduce过程慢 分组聚合导致数据倾斜 Hive未优化的分组聚合 方法1在MAP端直接聚合分组聚合优化减少Key MR失败 方法2随机数按随机数放入reduce中 解决数据倾斜 第二个Jobs按分组字段分区 因为生成随机了所以按 方法1和方法2 一起用是不影响的 先进行聚合 然后按随机数分配reduce 再启动一个job dierge job 按分组字段分区 join的数据倾斜 最后根据KEY进行分组 这里的数据倾斜的现象和影响是什么呢 1.map join 2. skew join 牺牲一个job为代价解决 将产生数据倾斜的Key去单独跑一个job 其实就是啥 map将大K提出来重新一个job 剩下的直接生成结果集然后job2的结果最后也注入结果集 根据参数判断 这里晚点多看一下 大表Join 对倾斜Key的表的key打散对关联的另一张表的key扩容 为什么 reduce 并行度 可以指定并行度也可以自动 可以设置最大值 为什么最大默认1009 可以设置reduce task数据量 估算Reduce并行度 reduce task量与数据量相关合理么 不合理因为收到的是map处理后的数据有可能已经变小很多了在reduce端小文件 但是无法获取map的数据量 3表join OBC如何优化 优化后 先进行小表合并 谓词下推 谓词下推predicate pushdown是指尽量将过滤操作前移以减少后续计算步骤的数据量。 CBO优化也会完成一部分的谓词下推优化工作因为在执行计划中谓词越靠前整个计划的计算成本就会越低。 –是否启动谓词下推predicate pushdown优化 set hive.optimize.ppd true; 白话 谓词下推先执行过滤条件再执行join hive本地模式 开启自动转换模式 符合条件用本地 不符合条件用集群 与直接设置HADOOP参数语句的不同 一个自动一个主动。 set mapreduce.framework.namelocal;
http://www.dnsts.com.cn/news/3128.html

相关文章:

  • 设计好看的美食网站有哪些新冠咳嗽怎么办
  • 台州网站建设方案优化企业培训体系
  • 自建房设计网站推荐百度浏览器网址
  • 网站系统升级中百度手机版下载
  • 程序源代码下载网站百度账号怎么注册
  • 阿里云网站空间做商城流程重庆森林电影
  • 布吉做棋牌网站建设哪家技术好sem竞价
  • 通信科技网站设计网络推广哪家好
  • 深圳网站建设 案例百度推广的几种方式
  • 做电商网站必需知道qc深圳广告公司排名
  • 团购产品 网站建设搜索引擎优化seo专员
  • 专门做外挂的网站推广恶意点击软件怎样使用
  • 怎么做才能设计出好的网站百度seo关键词排名优化工具
  • 罗湖网站建设的公司重庆seo网站哪家好
  • 怎做不下网站刷枪百度在线扫题入口
  • 重庆网站建设技术支持成人职业技术培训学校
  • 3d做网站seo培训网
  • 抖音seo工具上海seo网站推广
  • 做pc端网站教程百度分公司
  • 广州新塘建网站市场调研模板
  • 房地产设计网站软文发布平台排名
  • 九游下载安装载南宁百度seo排名价格
  • 如何引用网站图片长沙百度公司
  • c web网站开发实例网站推广系统方案
  • 用asp.net做网站的书谷歌seo网站排名优化
  • 做网站要考虑哪些因素视频号最新动作
  • 旅游网站开发毕业论文品牌推广和品牌营销
  • 那种登录才能查看的网站怎么做优化网站技术外包公司
  • 成都专业建站推广公司什么平台打广告比较好免费的
  • 网站如何做那种诱导广告爱站网长尾关键词挖掘工具