当前位置: 首页 > news >正文

咸阳市城市建设管理局网站个人简历模板范文手写

咸阳市城市建设管理局网站,个人简历模板范文手写,查看网站开发技术,苏州制作企业网站公司流处理和批处理是什么#xff1f; 什么是 Flink#xff1f; 为什么要学习 Flink#xff1f; Flink 有什么特点#xff0c;能做什么#xff1f; 本文将为你解答以上问题。 一、批处理和流处理 早些年#xff0c;大数据处理还主要为批处理#xff0c;一般按天或小时定时处… 流处理和批处理是什么 什么是 Flink 为什么要学习 Flink Flink 有什么特点能做什么 本文将为你解答以上问题。 一、批处理和流处理 早些年大数据处理还主要为批处理一般按天或小时定时处理数据代表性的框架为 MapReduce、Hive、Spark 等。 但是传统批处理的问题也很快显现 实时性低数据一般为 T-1 的数据数据存储方式无法按行进行修改需要按分区重写必须等数据都到了才能开始计算计算处理时间一般较长 为了解决批处理的问题流处理应运而生。 流处理能将实时产生的数据实时计算。将延迟降低到秒级或者毫秒级。 流处理引擎也已经经过了几代的发展需要一个高吞吐、低延迟、高性能的分布式处理框架。 Flink 作为如今的佼佼者在各大公司大规模使用下面我们来介绍下 Flink。 二、Flink是什么 Apache Flink 是一个面向分布式数据流处理和批量数据处理的开源计算平台提供流处理和批处理两种类型应用功能。 另一方面Apache Flink 是一个框架和分布式处理引擎用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行。 Flink 常见数据处理流程 左边是数据源可以是实时日志、数据库、文件系统等。 中间是Flink负责对数据进行处理。 右边是输出Flink可以将计算好的数据输出到其它应用中或者存储系统中。 三、特点 1、高吞吐、低延迟、高性能。 Flink 是目前开源社区中唯一一套集高吞吐、低延迟、高性能三者于一身的分布式流式处理框架。 像 Spark 使用微批处理方式使其在流式计算中无法做到低延迟保障 而 Storm 无法满足高吞吐的要求。 2、同时支持事件时间和处理时间语义。 处理时间好理解就是数据到达框架开始计算的时间此方式也方便实现。 另一个事件时间是指的数据产生时间。由于数据从产生到传入计算框架中间会经过多个服务也会因各种网络问题造成延迟导致数据并不是按照产生时间的先后顺序到达计算框架的。如何处理乱序数据是框架需要处理的一个重要问题。 Flink 则能够同时支持 事件时间 和 处理时间 进行窗口计算。 3、支持有状态计算并提供精确一次的状态一致性保障。 所谓状态就是之前数据计算得到的结果这个结果不光是输出的部分还包括中间算子的计算结果如 pv、uv 等。 这样当有下一个数据流入时不再需要将之前的数据再加上新数据重新计算直接用原来的结果继续算就行。这种方式极大地提升了系统的性能并降低了数据计算过程的资源消耗。 4、基于轻量级分布式快照实现的容错机制。 Flink 能够分布式运行在上千个节点上将一个大型计算任务的流程拆解成小的计算过程然后将 Task 分布到并行节点上进行处理。 通过基于分布式快照技术的 Checkpoints将执行过程中的状态信息进行持久化存储一旦任务出现异常终止Flink 就能够从 Checkpoints 中进行任务的自动恢复以确保数据中处理过程中的一致性。 5、保证了高可用动态扩展。 支持高可用性配置无单点失效和 Kubernetes、YARN、Apache Mesos 紧密集成快速故障恢复动态扩缩容作业等。基于上述特点它可以7 X 24小时运行流式应用几乎无须停机。 当需要动态更新或者快速恢复时Flink 通过 Savepoints 技术将任务执行的快照保存在存储介质上当任务重启的时候可以直接从事先保存的 Savepoints 恢复原有的计算状态使得任务继续按照停机之前的状态运行。 6、支持高度灵活的窗口操作。 Flink将窗口划分为基于 Time、Count、Session以及 Data-driven 等类型的窗口操作窗口可以用灵活的触发条件定制化来达到对复杂流传输模式的支持用户可以定义不同的窗口触发机制来满足不同的需求。 四、应用场景 在实际生产的过程中大量数据在不断地产生例如金融交易数据、互联网订单数据、GPS定位数据、传感器信号、移动终端产生的数据、通信信号数据等以及我们熟悉的网络流量监控、服务器产生的日志数据这些数据最大的共同点就是实时从不同的数据源中产生然后再传输到下游的分析系统。 针对这些数据类型主要包括以下场景Flink 对这些场景都有非常好的支持。暂时不理解如何起作用的没关系有个大概印象即可。 1、实时智能推荐 利用Flink流计算帮助用户构建更加实时的智能推荐系统对用户行为指标进行实时计算对模型进行实时更新对用户指标进行实时预测并将预测的信息推送给Web/App端帮助用户获取想要的商品信息另一方面也帮助企业提高销售额创造更大的商业价值。 2、复杂事件处理 例如工业领域的复杂事件处理这些业务类型的数据量非常大且对数据的时效性要求较高。我们可以使用Flink提供的CEP复杂事件处理进行事件模式的抽取同时应用Flink的SQL进行事件数据的转换在流式系统中构建实时规则引擎。 3、实时欺诈检测 在金融领域的业务中常常出现各种类型的欺诈行为。运用Flink流式计算技术能够在毫秒内就完成对欺诈判断行为指标的计算然后实时对交易流水进行规则判断或者模型预测这样一旦检测出交易中存在欺诈嫌疑则直接对交易进行实时拦截避免因为处理不及时而导致的经济损失 4、实时数仓与ETL 结合离线数仓通过利用流计算等诸多优势和SQL灵活的加工能力对流式数据进行实时清洗、归并、结构化处理为离线数仓进行补充和优化。另一方面结合实时数据ETL处理能力利用有状态流式计算技术可以尽可能降低企业由于在离线数据计算过程中调度逻辑的复杂度高效快速地处理企业需要的统计结果帮助企业更好的应用实时数据所分析出来的结果。 5、流数据分析 实时计算各类数据指标并利用实时结果及时调整在线系统相关策略在各类投放、无线智能推送领域有大量的应用。流式计算技术将数据分析场景实时化帮助企业做到实时化分析Web应用或者App应用的各种指标。 6、实时报表分析 实时报表分析说近年来很多公司采用的报表统计方案之一其中最主要的应用便是实时大屏展示。利用流式计算实时得出的结果直接被推送到前段应用实时显示出重要的指标变换最典型的案例就是淘宝的双十一实时战报。 五、小结 本文从批处理和流处理的区别入手为了处理实时数据流处理应运而生。在一代代流处理框架的演进过程中Flink 通过其高吞吐、低延迟、高性能的特点成为了当前炙手可热的流处理框架。 后面介绍了 Flink 框架的一些基本特点和应用场景带大家初步了解了 Flink 框架。 后续将带大家深入了解 Flink 框架的内存敬请期待。 参考文章 什么是流处理和批处理 Flink2为什么选择Flink - 掘金 Flink01快速了解Flink什么是Flink、Flink架构图、Flink三大核心组件、Flink的流处理与批处理、Storm vs SparkStreaming vs Flink-CSDN博客
http://www.dnsts.com.cn/news/89381.html

相关文章:

  • 做家教网站的资源是什么大型门户网站建设费用
  • 外贸soho怎么做网站网站上的二维码怎么做
  • 惠州网站制作工具行业类网站模板
  • 案例学习网站建设方案摸摸学校网站建设山东公司
  • 网站开发培训排名手机网站跟PC端网站有啥区别
  • 中国化工建设网站网站备案信息是什么意思
  • 网站建设兴田德润有专门做房孑特卖的网站吗
  • 做非经营网站需要营业执照微信crm下载
  • 互联网相关网站做电影网站有什么好处
  • aspx网站如何架设腾冲市住房和城乡建设局网站
  • 爱网站找不到了微机做网站的软件
  • 怎么自己做画册网站星沙网站建设公司
  • 投诉百度最有效的电话seo公司的选上海百首网络
  • 新站点seo联系方式淘宝是行业门户网站的盈利模式是什么
  • 经营网站的备案做阅读任务挣钱的网站
  • 有专业做网站优化的吗连云港网站建设价格
  • 创建网站好的平台做游戏用什么电脑系统下载网站
  • 台州网站策划浙江省人才网官方网站建设厅招聘
  • 根据网站软件做报告wordpress登录页面模板
  • 网站网站建设设计mysql 瓶颈 wordpress
  • 如皋市城乡建设局网站中文购物网站模板
  • 免费做cpa单页网站域名个人用户可以做企业网站吗
  • 桃城网站建设公司wordpress the
  • 提供专业网站小程序开发网络有限公司做女装网站的
  • 帝国cms做下载网站网站建设的软件有哪些
  • 做网站必须注册的商标wordpress主题代码显示行
  • 做网站的备案制作网页小程序
  • 国外试用网站空间帮忙网页设计师
  • 高端品牌网站建设定位余姚关键词优化公司
  • 如何做网站主赚钱销售公司简介模板