当前位置: 首页 > news >正文

做婚宴的网站有哪些wordpress 扫码付款

做婚宴的网站有哪些,wordpress 扫码付款,品牌建设规划制定及实施情况,长春网站建设小程【图解大数据技术】Hadoop、HDFS、MapReduce、Yarn HadoopHDFSHDFS架构写文件流程读文件流程 MapReduceMapReduce简介MapReduce整体流程 Yarn Hadoop Hadoop是Apache开源的分布式大数据存储与计算框架#xff0c;由HDFS、MapReduce、Yarn三部分组成。广义上的Hadoop其实是指H… 【图解大数据技术】Hadoop、HDFS、MapReduce、Yarn HadoopHDFSHDFS架构写文件流程读文件流程 MapReduceMapReduce简介MapReduce整体流程 Yarn Hadoop Hadoop是Apache开源的分布式大数据存储与计算框架由HDFS、MapReduce、Yarn三部分组成。广义上的Hadoop其实是指Hadoop生态圈包括的组件就不只是HDFS、MapReduce、Yarn还包括Spark、Flink、Zookeeper、Sqoop、Hive、HBase等工具但是我们讨论的不是Hadoop生态圈。 由于要解决大数据量的存储和计算问题因此数据不能再存储在关系型数据库而是存储在分布式文件系统HDFS中然后通过分布式离线计算框架MapReduce进行计算而Yarn则是负责资源调度也就是决定计算任务调度到哪些节点上执行。 HDFS HDFS是一个分布式文件系统用于存储海量的文件数据。其优点是可以存储达PB级别的文件数据百万级别以上的文件数量而缺点则是不适合低延时数据访问并且不支持文件修改只支持追加。 HDFS架构 HDFS一共由四部分组成Client、NameNode、DataNode、SecondaryNameNode。 Client负责文件上传之前的文件切分切分好后传输每一个文件数据块到DataNode上传数据块前询问NameNode该数据块上传的目标DataNode从HDFS读取文件前询问NameNode返回文件元数据信息再根据元数据从DataNode读取每个数据块。NameNode接受DataNode的注册存储文件的元数据信息配置副本策略等。DataNode存储文件数据块。SecondaryNameNode给NameNode进行FsImage磁盘中的元数据和Edits内存中的元数据还未写入FsImage在Edits中进行追加写记录日志的合并。 写文件流程 文件写入流程如下 客户端在上传文件时会进行文件切割把文件切割成一个一个的数据块block然后分别上传每个数据块上传每个数据块时询问NameNode得知该数据块传输到哪些DataNode上然后根据NameNode返回结果上传数据块到DataNode。 读文件流程 文件读取流程如下 NameNode记录了文件元数据信息比如哪个block存储在哪些DataNode。Client读取文件时请求NameNode获取元数据信息就可以根据元数据信息请求对应的DataNode读取对应的每个block。 MapReduce MapReduce简介 MapReduce是一个分布式离线计算框架专门用于处理大数据场景中与实时性无关的一些离线计算任务。 MapReduce的数据输入一般是HDFS然后经过InputFormat进行输入格式化变成K,V格式然后执行用户实现的Mapper类型的map方法进行数据映射映射处理的结果也是K,V格式然后执行一个shuffle过程对映射结果进行按key进行分组分区把同一区域的所有KV发送到同一个Reducer由一个节点进行Reducer对同一个key分组下的所有value进行聚合操作然后Reducer的输出结果再经过OutputFormat进行格式化处理后进行结果输出。 MapReduce整体流程 下面是MapReduce运行的整体流程 client从HDFS读取指定文件的元数据然后根据文件大小和block大小计算切片信息得出切片规划文件然后提交job到Yarn指定的路径job中包括切片规划文件和jar包等这个jar包包含了用户编写的Mapper和Reducer。Yarn根据切片数量计算MapTask的数据量一般一个block对应一个MapTask然后把对应的task和程序启动脚本分派给block所在的节点上运行。每个节点执行对应的MapTask默认的InputFormat读取每一行数据然后以该行数据在文件中的起始字节偏移量为key行数据本身作为value调用Mapper的map方法。Mapper的map方法进行数据映射处理那是用户自己实现的逻辑。对计算结果进行Shuffle处理根据key进行分组排序然后对所有的key进行分区处理同一分区的所有key会指派给一个ReduceTask执行每个ReduceTask又会分派给一个节点执行。执行ReduceTask的节点下载分区数据然后对不同MapTask得出的同一partition进行合并并排序。调用Reducer的reduce方法进行相应的聚合计算这里也是由用户自己实现。OutputFormation把Reducer产生的结果做格式化处理默认会写为行数据。最后把结果存入HDFS中。 Yarn Yarn是负责资源调度的由Yarn管理每个Node节点然后进行任务分派也就是把MapTask和ReduceTask分配给对应的Node。 yarn有ResourceManager和NodeManager两角色。ResourceManager负责监控NodeManager接收客户端提交的job然后进行资源分配调度NodeManager负责管理单个节点上的资源并执行ResourceManager的命令启动并运行相应的MapTask和ReduceTask。 然而真正进行任务分配的并不是ResourceManagerResourceManager每接收一个job会选一个NodeManager来启动一个ApplicationMaster由ApplicationMaster向ResourceManager申请资源并发送任务和启动脚本到对应的NodeManager。 而task都是在Container中运行Container是节点资源的抽象比如cpu、内存等也就是限制了该task只能使用这么多资源避免一个task占满整个node的所有资源。
http://www.dnsts.com.cn/news/257884.html

相关文章:

  • 设计网站免费下载网页网页设计制作公司
  • 铜陵做网站的公司网站等保如何做
  • 好的网站模板公司网页网站建设 ppt
  • wordpress 多站点 合集做网站公司需要帮客户承担广告法吗
  • 徐州企业自助建站包头正大光电 做网站
  • 提供网站制作公司报价ppt模板免费下载完整版免费简约
  • 南京网站设计课程网站建设建议
  • 网站首页改版影响优化小说手机网站建设
  • 个人网站怎么做 简历电子加工东莞网站建设
  • 纪念馆网站建设做个人网站需要哪些
  • 志迅东莞网站建设wordpress设置ip白名单
  • 网站正在建设 h5模板建设婚介网站
  • 科技类网站设计特点一个wordpress程序搭建多个网站
  • 帝国+只做网站地图纯注册app拉新挣钱
  • 南通seo网站价格网站建设制作文字教程
  • 做手机网站用什么设计工作室网站推荐
  • 二级网站建设情况说明美大门店管理系统
  • 张家港做网站的推荐seo综合查询国产
  • 在线服装设计网站国外源码网站
  • 青岛网站推广关键词h5企业模板网站模板下载
  • 自己做网站需要学些什么做的比较唯美的网站有哪些
  • 泉州专业建站公司张店网站开发招聘
  • 哪些网站的活动策划做的好图片上传不了网站
  • 阿里巴巴网站费用怎么做分录seo为什么不景气了
  • 北京网站制作公司报价公司企业简介图片
  • 有没有兼职做设计的网站吗靖安县城乡规划建设局网站
  • seo查询网站是什么网站 mvc 设计
  • 90设计网站可以商用吗东莞网站优化是什么
  • 如何做好电商群排名优化软件
  • 电商网站有哪些功能wordpress经典编辑器