当前位置: 首页 > news >正文

网站设计步骤及图解厦门市建设合同备案网站

网站设计步骤及图解,厦门市建设合同备案网站,北京seo教师,山西省建设厅执业资格注册中心网站spark的算子 1.spark的单Value算子 Spark中的单Value算子是指对一个RDD中的每个元素进行操作#xff0c;并返回一个新的RDD。下面详细介绍一些常用的单Value算子及其功能#xff1a; map#xff1a;逐条映射#xff0c;将RDD中的每个元素通过指定的函数转换成另一个值并返回一个新的RDD。下面详细介绍一些常用的单Value算子及其功能 map逐条映射将RDD中的每个元素通过指定的函数转换成另一个值最终返回一个新的RDD。 rdd sc.parallelize([1, 2, 3, 4, 5]) result rdd.map(lambda x: x * 2) # result: [2, 4, 6, 8, 10]flatMap: 扁平化映射将RDD中的每个元素通过指定的函数转换成多个值并将这些值展开为一个新的RDD。 rdd sc.parallelize([1, 2, 3, 4, 5]) result rdd.flatMap(lambda x: range(x, x3)) # result: [1, 2, 3, 2, 3, 4, 3, 4, 5, 4, 5, 6, 5, 6, 7]glom将一个分区中的多个单条数据转换为相同类型的单个数组进行处理。返回一个新的RDD其中每个元素是一个数组。 rdd sc.parallelize([1, 2, 3, 4, 5], 2) # 两个分区 result rdd.glom().collect() # result: [[1, 2], [3, 4, 5]]groupBy: 将RDD中的元素按照指定条件分组返回一个键值对RDD其中的每个元素是一个(key, iterator)对key为分组的条件iterator为对应分组的元素迭代器。 rdd sc.parallelize([apple, banana, cherry, date]) result rdd.groupBy(lambda x: x[0]) # result: [(a, [apple]), (b, [banana]), (c, [cherry]), (d, [date])]filter根据指定的规则过滤出符合条件的元素返回一个新的RDD。 rdd sc.parallelize([1, 2, 3, 4, 5]) result rdd.filter(lambda x: x % 2 0) # result: [2, 4]sample从RDD中进行采样返回一个包含采样结果的新的RDD。 rdd sc.parallelize(range(10)) result rdd.sample(False, 0.5) # result: [0, 2, 3, 4, 5, 7]distinctshuffle去重将RDD中重复的元素去除返回一个由不重复元素组成的新的RDD。 rdd sc.parallelize([1, 2, 2, 3, 3, 3]) result rdd.distinct() # result: [1, 2, 3]coalesceshuffle缩减分区将RDD的分区数缩减为指定的数量。 rdd sc.parallelize([1, 2, 3, 4, 5], 4) # 4个分区 result rdd.coalesce(2) # result: [1, 2, 3, 4, 5]分区数变为2repartitionshuffle扩增分区数底层是coalesce。将RDD的分区数扩增到指定的数量。 rdd sc.parallelize([1, 2, 3, 4, 5], 2) # 2个分区 result rdd.repartition(4) # result: [1, 2], [3, 4], [5]分区数变为4sortByshuffle根据指定的规则对数据源中的数据进行排序默认为升序。 rdd sc.parallelize([3, 1, 4, 2, 5]) result rdd.sortBy(lambda x: x) # result: [1, 2, 3, 4, 5]这些单Value算子能够对RDD中的每个元素进行处理并返回一个新的RDD可以用于各种数据转换、过滤、去重等操作。 2. Spark的双Value算子 双Value算子是指对两个RDD进行操作并返回一个新的RDD。下面介绍一些常用的双Value算子及其功能 union: 对两个RDD求并集返回包含两个RDD中所有元素的新RDD。 rdd1 sc.parallelize([1, 2, 3]) rdd2 sc.parallelize([3, 4, 5]) result rdd1.union(rdd2) # result: [1, 2, 3, 3, 4, 5]intersection: 对两个RDD求交集返回包含两个RDD中共有元素的新RDD。 rdd1 sc.parallelize([1, 2, 3]) rdd2 sc.parallelize([3, 4, 5]) result rdd1.intersection(rdd2) # result: [3]subtract: 对两个RDD求差集返回只属于第一个RDD而不属于第二个RDD的元素的新RDD。 rdd1 sc.parallelize([1, 2, 3]) rdd2 sc.parallelize([3, 4, 5]) result rdd1.subtract(rdd2) # result: [1, 2]cartesian: 对两个RDD进行笛卡尔积操作返回所有可能的元素对组成的新RDD。 rdd1 sc.parallelize([1, 2]) rdd2 sc.parallelize([a, b]) result rdd1.cartesian(rdd2) # result: [(1, a), (1, b), (2, a), (2, b)]zip: 将两个RDD的元素按照索引位置进行配对返回键值对组成的新RDD。 rdd1 sc.parallelize([1, 2, 3]) rdd2 sc.parallelize([a, b, c]) result rdd1.zip(rdd2) # result: [(1, a), (2, b), (3, c)]join: 对两个键值对RDD进行内连接操作返回具有相同键的元素对组成的新RDD。 rdd1 sc.parallelize([(1, apple), (2, banana)]) rdd2 sc.parallelize([(1, red), (2, yellow)]) result rdd1.join(rdd2) # result: [(1, (apple, red)), (2, (banana, yellow))]leftOuterJoin: 对两个键值对RDD进行左外连接操作返回左侧RDD中所有元素以及与之匹配的右侧RDD中的元素对组成的新RDD。 rdd1 sc.parallelize([(1, apple), (2, banana)]) rdd2 sc.parallelize([(1, red), (3, yellow)]) result rdd1.leftOuterJoin(rdd2) # result: [(1, (apple, red)), (2, (banana, None))]rightOuterJoin: 对两个键值对RDD进行右外连接操作返回右侧RDD中所有元素以及与之匹配的左侧RDD中的元素对组成的新RDD。 rdd1 sc.parallelize([(1, apple), (2, banana)]) rdd2 sc.parallelize([(1, red), (3, yellow)]) result rdd1.rightOuterJoin(rdd2) # result: [(1, (apple, red)), (3, (None, yellow))]这些双Value算子能够对两个RDD进行操作并返回一个新的RDD可以用于求并集、交集、差集等操作也可以进行连接操作根据键值对进行配对。 3. Spark的Key-Value算子 Key-Value算子是指对键值对RDD进行操作的算子这些算子主要用于处理具有键值对结构的数据其中键位于第一列值位于第二列。下面介绍一些常用的Key-Value算子及其功能 reduceByKey: 对具有相同键的元素进行聚合操作返回一个新的键值对RDD。 rdd sc.parallelize([(1, 2), (1, 3), (2, 4), (2, 5)]) result rdd.reduceByKey(lambda x, y: x y) # result: [(1, 5), (2, 9)]groupByKey: 对具有相同键的元素进行分组操作返回一个新的键值对RDD。 rdd sc.parallelize([(1, 2), (1, 3), (2, 4), (2, 5)]) result rdd.groupByKey() # result: [(1, pyspark.resultiterable.ResultIterable object at 0x7f3128a3e370), (2, pyspark.resultiterable.ResultIterable object at 0x7f3128a3e3d0)]sortByKey: 按照键的顺序对RDD进行排序操作默认升序排列。 rdd sc.parallelize([(3, apple), (1, banana), (2, orange)]) result rdd.sortByKey() # result: [(1, banana), (2, orange), (3, apple)]mapValues: 对键值对RDD中的值进行操作返回一个新的键值对RDD。 rdd sc.parallelize([(1, apple), (2, banana)]) result rdd.mapValues(lambda x: fruit x) # result: [(1, fruit apple), (2, fruit banana)]flatMapValues: 对键值对RDD中的值进行扁平化操作返回一个新的键值对RDD。 rdd sc.parallelize([(1, hello world), (2, goodbye)]) result rdd.flatMapValues(lambda x: x.split()) # result: [(1, hello), (1, world), (2, goodbye)]keys: 返回所有键组成的一个新的RDD。 rdd sc.parallelize([(1, apple), (2, banana)]) result rdd.keys() # result: [1, 2]values: 返回所有值组成的一个新的RDD。 rdd sc.parallelize([(1, apple), (2, banana)]) result rdd.values() # result: [apple, banana]除了上述提到的常用Key-Value算子还有一些其他常见的Key-Value算子它们在处理键值对RDD时也非常有用。以下是其中几个 countByKey: 统计每个键出现的次数返回一个字典。 rdd sc.parallelize([(1, apple), (1, banana), (2, orange), (2, banana)]) result rdd.countByKey() # result: {1: 2, 2: 2}collectAsMap: 将键值对RDD转换为字典形式。 rdd sc.parallelize([(1, apple), (2, banana)]) result rdd.collectAsMap() # result: {1: apple, 2: banana}lookup: 查找具有给定键的所有值并返回一个列表。 rdd sc.parallelize([(1, apple), (2, banana), (1, orange)]) result rdd.lookup(1) # result: [apple, orange]foldByKey: 对具有相同键的元素进行折叠操作类似于reduceByKey但可以指定初始值。 rdd sc.parallelize([(1, 2), (1, 3), (2, 4), (2, 5)]) result rdd.foldByKey(0, lambda x, y: x y) # result: [(1, 5), (2, 9)]aggregateByKey: 对具有相同键的元素进行聚合操作可以指定初始值和两个函数一个用于局部聚合另一个用于全局聚合。 rdd sc.parallelize([(1, 2), (1, 3), (2, 4), (2, 5)]) result rdd.aggregateByKey(0, lambda x, y: x y, lambda x, y: x y) # result: [(1, 5), (2, 9)]这些Key-Value算子能够对键值对RDD进行操作实现聚合、分组、排序、映射等功能。使用这些算子可以更方便地处理具有键值对结构的数据。
http://www.dnsts.com.cn/news/10040.html

相关文章:

  • 怎样建企业网站flashfxp 发布网站
  • 中国国际室内设计网官网seo作用与原理思维导图
  • 桂林医院网站建设长沙做企业网站的公司
  • 网站如何设置二级域名北京网站制作定制
  • 两学一做教育考试网站互联网商城有限公司
  • 怎么用wordpress建立自己的网站企业网站建设优化策划
  • 学生个人博客网站模板wordpress谷歌广告
  • 徐州新沂网站建设wordpress中文插件seo百度
  • 如何做付款网站网站小图片素材
  • 深圳网站建设网站设计软文推广qq群推广拉人
  • 上海外贸网站优化页面设计层次架构包括什么
  • 做网站投广告赚钱么网站如何设计搜索框
  • 在线直播系统开发山东网络优化公司排名
  • 中国制造网国际站官网qq是哪个公司开发的
  • 怎么用云服务器建设网站乱起封神是那个网站开发的
  • 曲靖企业网站北京网站设计制作多少钱
  • 女人能做网站开发吗鲜花网站建设主要内容
  • 厦门网站建设 孚珀科技html代码特效
  • 长沙房产集团网站建设青岛网站设计建议i青岛博采
  • 建设网站的规划书小广告制作模板
  • 做网站一般用什么语言北京网站开发工程师
  • 建设网站阿里云服务器wordpress 主题课堂
  • 成都网站建设v芯ee8888e网站底部连接怎么做
  • 做综合类网站好不好wordpress 淘客
  • 厦门网站建设和人才库建设做外单网站有哪些
  • 浙江凌宇环境建设公司网站襄阳 网站建设
  • 网站备案网站前置审批建设信用卡积分兑换网站
  • 站长工具seo域名解析不了织梦网站手机版怎么做
  • 重庆网站建设子沃科技熊掌号门户网站建设审批程序
  • 镇江建设质量监督站网站做响应式网站怎么设计