当前位置: 首页 > news >正文

政协网站信息化建设的作用阿里云网站开发工具

政协网站信息化建设的作用,阿里云网站开发工具,展示设计公司有哪些,江苏天矗建设集团网站Spark SQL优化机制Spark SQLCatalyst 优化器逻辑优化物理优化TungstenUnsafe RowWSCGRDD 缺点 : RDD的算子都是高阶函数 #xff0c;Spark Core 不知函数内的操作#xff0c;只能闭包形式发给 Executors#xff0c; 无法优化 DataFrame 不同点#xff1a; 数据的表示形式… Spark SQL优化机制Spark SQLCatalyst 优化器逻辑优化物理优化TungstenUnsafe RowWSCGRDD 缺点 : RDD的算子都是高阶函数 Spark Core 不知函数内的操作只能闭包形式发给 Executors 无法优化 DataFrame 不同点 数据的表示形式 有数据模式Data Schema的结构化数据开发算子 一套 DSL算子Domain Specific Language) Spark 能用 DataFrame 基于启发式的规则或策略动态的运行时信息去优化 DataFrame 的计算过程 Spark SQL Spark Core 特指 Spark 底层执行引擎Execution Engine包括调度系统、存储系统、内存管理、Shuffle 管理Spark SQL 基于 Spark Core 上有一层独立的优化引 (Optimization Engine) Spark Core/Spark SQL关系 Spark SQL 优化后的代码交给 Spark Core 执行 Spark SQL 的两个核心组件Catalyst 优化器 /Tungsten Catalyst 优化器负责创建并优化执行计划有 3 个功能模块创建语法树并生成执行计划、逻辑阶段优化、物理阶段优化Tungsten 负责优化数据结果与可执行代码 衔接 Catalyst 执行计划与底层的 Spark Core 执行引擎 Catalyst 优化器 Catalyst 优化器的作用在逻辑优化阶段基于启发式的规则和策略调整、优化执行计划为物理优化阶段提升性能奠定基础 逻辑优化 Catalyst 的优化过程 : 先用第三方的 SQL 解析器 ANTLR 生成抽象语法树ASTAbstractSyntax Tree AST 的两个基本元素构成 节点各式各样的操作算子如 : select、filter、agg边 : 记录了数据表的 Schema 信息 如 : 字段名、字段类型 AST 语法树/执行计划(Execution Plan ) Parquet 格式在文件层面支持两项特性 : 谓词下推、列剪枝 都是启发式的规则或策略谓词下推 (Predicates Pushdown) : batchNum 201601的过滤条件在扫描过程时只读取那些满足条件的数据文件列剪枝 (Columns PruningParquet 是列存 (Columns Store) 数据结构只取某个字段名的数据文件时就会剪掉其他数据文件的过程 Spark 只扫描绿色部分 : 逻辑优化的执行计划 执行顺序 : Scan Filter Select变成 Filter Select Scan 物理优化 Catalyst 的优化阶段差异 逻辑阶段 依赖先验的启发式经验 基于经验优化物理阶段依赖各式各样的统计信息如数据表尺寸、是否启用数据缓存、Shuffle 中间文件 基于数据优化 Join 节点物理阶段优化 采用哪种实现机制实现关联嵌套循环连接NLJNested Loop Join、排序归并连接Sort Merge Join、哈希连接Hash Join采用哪种数据分发实现关联Shuffle Join 和 Broadcast Join根据两张表的存储大小决定采用 运行稳定但性能略差的 Shuffle Sort Merge Join 或 执行性能更佳的 Broadcast Hash Join Tungsten 基于Catalyst Tungsten 在数据结构/执行代码进行进一步的优化 数据结构优化 Unsafe Row 的设计与实现执行代码优化全阶段代码生成WSCGWhole Stage Code Generation Unsafe Row Spark SQL 默认采用 org.apache.spark.sql.Row 对象对每条数据进行封装和存储Java Object 会有大量的存储开销 Unsafe Row 是二进制数据结构以字节数组的格式存储每条数据能减少存储开销 采用默认的 Row存储 每条记录需要消耗至少 60 个字节 采用 Tungsten Unsafe Row 存储 每条数据记录仅需消耗十几个字节 WSCG WSCG全阶段代码生成 全阶段调度系统中的 Stage代码生成运行时把链式调用的算子合成一份代码。如把 Filter、Select、Scan 合成一个函数 绿色节点属于同一个 Stage
http://www.dnsts.com.cn/news/99311.html

相关文章:

  • 学校如何重视校园网站建设海口市龙华区核酸检测
  • 高端网站建设设计湖北手机网站建设
  • 移动网站建设专业论文普通网站跟营销型网站的对比
  • saas云建站平台源码济南住建局官方网站
  • 建站平台绑定域名在百度做推广送网站好吗
  • 太湖云建站网站建设网站内容 优化
  • 专业网站建设首选公司长春火车站咨询电话号码是多少
  • 网站怎样做wap端做编程的网站有哪些内容
  • 梅州做网站网站建设验收总结讲话
  • 广州营销型网站建设招聘网站销售怎么做
  • 腾讯云做网站步骤视觉设计的网站和app
  • 不想用原来的网站模板了就用小偷工具采集了一个可是怎么替换wordpress可以和微信公众号对接
  • 深圳的设计网站公司应用asp做网站
  • vs网站开发建表怎么肩啊wordpress 热门主题
  • 公司网站上传图库上海网站建设-中国互联
  • 用织梦做网站快吗小叮当网站建设
  • 怎么做网站导流生意it培训机构哪些比较好
  • 做网站怎么防止被黑沧州建设厅网站
  • 安阳网站公司哪家好兰州网站排名外包
  • 机械营销型网站泰安房产成交信息网
  • 网站源码下载教程网站建设中下载
  • 杭州网站建设宣盟网络网站怎么做导航条
  • 做网站切片正规代加工项目
  • 织梦模板网站源码哈尔滨网站建设方案服务
  • 梁山县城市建设局网站wordpress pdf文章
  • 怎么用织梦模板做网站响应式网站开发支持ie6解决
  • 网站建设人员的组织辽宁省建设工程信息网必须用主锁
  • 江苏省实训基地建设网站廊坊创景科技有限公司开发的app
  • 网站关键词如何做竞价外贸公司有哪些岗位
  • 城乡和住房建设厅网站首页企业维护