当前位置: 首页 > news >正文

南宁网站seo推广优化公司广州建筑业企业排名

南宁网站seo推广优化公司,广州建筑业企业排名,国际新闻最新消息内容,网页和网站有什么分别背景 Spark 3.5 最近在看Spark UI 上的一些指标看到一个很有意思的东西, 相邻的Shuffle Exechange 和 BroadcastExechange 中的 datasize 居然不一样#xff0c; 前者为 765KB, 后者为 64.5MB。差别还不少#xff0c;中间就增加了一个 AQEShuffleRead 计划 结论 Shuffle E…背景 Spark 3.5 最近在看Spark UI 上的一些指标看到一个很有意思的东西, 相邻的Shuffle Exechange 和 BroadcastExechange 中的 datasize 居然不一样 前者为 765KB, 后者为 64.5MB。差别还不少中间就增加了一个 AQEShuffleRead 计划 结论 Shuffle Exechange 中的是真实 UnsafeRow的大小 BroadcastExechange 中的是 MemoryBlock 类型数据结构所占的大小 而不是UnsafeRow的大小。 且BroadcastExechange中的datasize大小 和 2的整数倍接近。 现象以及分析 上图 两个同样的 ShuffleExechange 记录条数和 ShuffleExechange 中 datasize 大小不一样而在BroadcastExechange 中 dataSize 大小却是一样的都是64.5MB 关于 ShuffleExchange中的 dataSize的计算可以参考:Spark UI中Shuffle dataSize 和shuffle bytes written 指标区别这里重点分析一下后者. 直接看BroadcastExechange代码: override lazy val relationFuture: Future[broadcast.Broadcast[Any]] {SQLExecution.withThreadLocalCaptured[broadcast.Broadcast[Any]](session, BroadcastExchangeExec.executionContext) {try {// Setup a job tag here so later it may get cancelled by tag if necessary.sparkContext.addJobTag(jobTag)sparkContext.setInterruptOnCancel(true)val beforeCollect System.nanoTime()// Use executeCollect/executeCollectIterator to avoid conversion to Scala typesval (numRows, input) child.executeCollectIterator()...val relation mode.transform(input, Some(numRows))val dataSize relation match {case map: HashedRelation map.estimatedSizecase arr: Array[InternalRow] arr.map(_.asInstanceOf[UnsafeRow].getSizeInBytes.toLong).sumcase _ throw new SparkException([BUG] BroadcastMode.transform returned unexpected stype: ${relation.getClass.getName})}longMetric(dataSize) dataSize其中child.executeCollectIterator() 是在把数据从各个 Executor 收集到 Driver 端来便于进行广播操作。 最主要的是 mode.transform(input, Some(numRows))这里的数据流如下: HashedRelationBroadcastMode.transform||\/ HashedRelation.apply(rows, key, numRows.toInt, isNullAware isNullAware)||\/ UnsafeHashedRelation.apply(input, key, sizeEstimate, mm, isNullAware, allowsNullKey,ignoresDuplicatedKey)||\/ new UnsafeHashedRelation(key.size, numFields, binaryMap) 最终调用的 UnsafeHashedRelation.estimatedSize的方法 override def estimatedSize: Long binaryMap.getTotalMemoryConsumption 而 getTotalMemoryConsumption 是dataPages所占用的大小再加上longArray的大小 public long getTotalMemoryConsumption() {long totalDataPagesSize 0L;for (MemoryBlock dataPage : dataPages) {totalDataPagesSize dataPage.size();}return totalDataPagesSize ((longArray ! null) ? longArray.memoryBlock().size() : 0L);} 那么 BytesToBytesMap 是怎么分配的呢如下 val binaryMap new BytesToBytesMap(taskMemoryManager,// Only 70% of the slots can be used before growing, more capacity help to reduce collision(sizeEstimate * 1.5 1).toInt,pageSizeBytes) 默认的PageSize值为defaultPageSizeBytes: private lazy val defaultPageSizeBytes {val minPageSize 1L * 1024 * 1024 // 1MBval maxPageSize 64L * minPageSize // 64MBval cores if (numCores 0) numCores else Runtime.getRuntime.availableProcessors()// Because of rounding to next power of 2, we may have safetyFactor as 8 in worst caseval safetyFactor 16val maxTungstenMemory: Long tungstenMemoryMode match {case MemoryMode.ON_HEAP onHeapExecutionMemoryPool.poolSizecase MemoryMode.OFF_HEAP offHeapExecutionMemoryPool.poolSize}val size ByteArrayMethods.nextPowerOf2(maxTungstenMemory / cores / safetyFactor)val chosenPageSize math.min(maxPageSize, math.max(minPageSize, size))if (Utils.isG1GC tungstenMemoryMode MemoryMode.ON_HEAP) {chosenPageSize - Platform.LONG_ARRAY_OFFSET} else {chosenPageSize}} 这个跟内存以及core有关。 当在进行val loc binaryMap.lookup 以及loc.append操作的时候就会进行dataPage以及longArray的分配。而该size的大小并不是实际占用的大小而是分配给该dataPage的大小。其实你会发现该datasize的大小几乎和2的倍数接近。
http://www.dnsts.com.cn/news/265445.html

相关文章:

  • 网站开发费用怎么做账张梅 合肥网站建设
  • 做网站 会计分录点击精灵seo
  • 微网站开发商ip网站架设
  • js网站跳转代码资兴做网站公司
  • 国家 住房城乡建设信用 网站微官网入口
  • 关于网站项目建设的申请汕头公司建站模板
  • 数据库电影网站源码如何登录网站制作平台
  • wamp网站建设前端软件开发工程师
  • 对网站开发流程的认识etherna 简洁商业企业wordpress
  • 谁有手机网站发几个吧西安微信网站
  • app介绍网站模板免费下载wordpress模板底部版权怎么修改
  • php做网站一般用什么软件网站优化排名
  • 国外做网站侵权网站建设服务器怎么设置
  • 山西推广网站建设php网站培训机构企业做网站
  • 新东方在线网上课程seo技术分享免费咨询
  • 网站运营策划方案网站建设与管理考题
  • 如何做代刷网站revolution slider wordpress
  • 营销网站建设门户公司备案可以做购物网站吗
  • 做网站搜索框广州工商学院官网
  • 公司推广网站建设话术wordpress 导出数据库
  • 做网站 被谷歌收录大学 两学一做专题网站
  • 网站视觉设计方案广东深圳职业技术学校
  • 建站公司的服务器东莞网络优化服务商
  • 超实用网站如果安装wordpress主题
  • 做论坛网站怎么赚钱吗网站底部信息
  • 做网站模板用什么软件搜索引擎优化的主要工作
  • 生鲜网站模板西安网页制作培训机构
  • 域名不作网站用途指数函数图像及性质
  • 建设房产网站网站用哪些系统做的比较好用
  • 网站建设 试卷dedecms 如何关闭网站