当前位置: 首页 > news >正文

接做网站需要问什么绿色建筑设计

接做网站需要问什么,绿色建筑设计,好网站建设公司哪家好,建筑工程师培训学校目录 一、离线数仓 1. 离线数仓是什么#xff1f; 2. 离线数仓的特点 3. 离线数仓的适用场景 二、实时数仓 1. 实时数仓是什么#xff1f; 2. 实时数仓的特点 3. 实时数仓的适用场景 三、由数仓需求变化带来的数据仓库架构的演变 1. 传统数仓架构 2. 离线大数据架构 3. Lambd… 目录 一、离线数仓 1. 离线数仓是什么 2. 离线数仓的特点 3. 离线数仓的适用场景 二、实时数仓 1. 实时数仓是什么 2. 实时数仓的特点 3. 实时数仓的适用场景 三、由数仓需求变化带来的数据仓库架构的演变 1. 传统数仓架构 2. 离线大数据架构 3. Lambda架构 4. Kappa架构 5. 混合架构 四、实时数仓和离线数仓的思考与总结 实时数仓和离线数仓都是数据仓库的不同类型用于存储和管理企业的数据但它们在数据处理和使用的时间、速度以及用途方面有明显的区别。 在介绍实时数仓之前我们理应先来了解一下传统的离线数仓。毕竟在企业早期的数据建设规划中在数据实时性要求不高的前提下基本一开始都会选择建设离线数仓。 一、离线数仓 1. 离线数仓是什么 离线数仓Offline Data Warehouse是一个用于存储和处理批处理数据的系统。它的特点是数据的处理和分析是基于批处理作业进行的通常以较长的时间周期为单位。传统离线数仓的数据时效性是 T1调度频率以天为单位无法支撑实时场景的数据需求。即使能将调度频率设置成小时也只能解决部分时效性要求不高的场景对于实效性要求很高的场景还是无法优雅的支撑。 2. 离线数仓的特点 批处理离线数仓通过批处理作业处理数据这意味着数据在一定时间周期内收集、存储然后一次性处理。高容量离线数仓通常设计用于存储大量历史数据。延迟较高由于数据处理是批处理的因此离线数仓不适合需要实时或近实时数据的应用。 3. 离线数仓的适用场景 需要进行历史数据分析、报告生成的应用如销售报告、月度财务报表等。数据量较大且处理时间不是关键问题的应用。 但是随着企业的发展数据量日益增大传统数据的方案在时效性上和数据维护上变得越来越困难。这时实时数仓应运而生。 二、实时数仓 1. 实时数仓是什么 实时数仓Real-time Data Warehouse是一个用于存储和处理实时数据的系统。它的主要特点是数据的处理和分析是即时进行的数据几乎立即进入数仓并可以立即用于分析和决策。 2. 实时数仓的特点 低延迟实时数仓能够在数据产生后迅速将其捕捉和处理通常以秒或亚秒级的速度。数据流处理实时数仓通常使用流式处理技术来处理数据这允许数据在进入仓库时立即进行转换和计算。实时分析数据可以用于实时监控、仪表板、预测和决策支持。高吞吐量实时数仓需要处理大量的数据流因此需要具备高吞吐量的性能。复杂性由于需要处理实时数据流实时数仓的架构和技术通常比较复杂。 3. 实时数仓的适用场景 需要实时监控业务指标的应用如金融交易看板、实时销售报表、在线广告投放分析等。需要立即采取行动以应对实时事件的应用如异常监测大屏、欺诈实时检测等。 三、由数仓需求变化带来的数据仓库架构的演变 从1990年 Inmon 提出数据仓库概念到今天数仓架构经历了最初的传统数仓架构、离线大数据架构、Lambda 架构、Kappa 架构以及由Flink 的火热带出的流批一体架构数据架构技术不断演进本质是在往流批一体的方向发展让用户能以最自然、最小的成本完成实时计算。 1. 传统数仓架构 这是比较传统的一种方式结构或半结构化数据通过离线ETL定期加载到离线数仓之后通过计算引擎取得结果供前端使用。这里的离线数仓计算引擎通常是使用大型商业数据库来承担例如Oracle、DB2、Teradata等。 2. 离线大数据架构 随着数据规模的不断增大传统数仓方式难以承载海量数据。随着大数据技术的普及采用大数据技术来承载存储与计算任务。数据源通过离线的方式导入到离线数仓中。下游应用根据业务需求选择直接读取 DM 或加一层数据服务比如 MySQL 或 Redis。 数据仓库从模型层面分为三层 ODS操作数据层保存原始数据DWD数据仓库明细层根据主题定义好事实与维度表保存最细粒度的事实数据DM数据集市/轻度汇总层在 DWD 层的基础之上根据不同的业务需求做轻度汇总 当然也可以使用传传统数据库集群或MPP架构数据库来完成。例如HadoopHive/Spark、Oracle RAC、GreenPlum等。 3. Lambda架构 随着业务的发展随着业务的发展人们对数据实时性提出了更高的要求。此时出现了Lambda架构其将对实时性要求高的部分拆分出来增加条实时计算链路。从源头开始做流式改造将数据发送到消息队列中实时计算引擎消费队列数据完成实时数据的增量计算。与此同时批量处理部分依然存在实时与批量并行运行。最终由统一的数据服务层合并结果给于前端。一般是以批量处理结果为准实时结果主要为快速响应。 4. Kappa架构 而Lambda架构一个比较严重的问题就是需要维护两套逻辑。一部分在批量引擎实现一部分在流式引擎实现维护成本很高。此外对资源消耗也较大。随后诞生的Kappa架构正是为了解决上述问题。其在数据需要重新处理或数据变更时可通过历史数据重新处理来完成。方式是通过上游重放完成(从数据源拉取数据重新计算)。 可Kappa架构最大的问题是流式重新处理历史的吞吐能力会低于批处理但这个可以通过增加计算资源来弥补。 5. 混合架构 上述架构各有其适应场景有时需要综合使用上述架构组合满足实际需求。当然这也必将带来架构的复杂度。用户应根据自身需求有所取舍。在一般大多数场景下是可以使用单一架构解决问题。现在很多产品在流批一体、海量、实时性方面也有非常好的表现可以考虑这种“全能手”解决问题。 四、实时数仓和离线数仓的思考与总结 通常企业可能会同时使用实时数仓和离线数仓来满足不同的需求以确保能够有效地处理各种类型的数据。这种情况下这两者可能会集成以充分利用它们的优势。 另外想说明的是实时数仓方案并不是“搬过来”而是根据业务“演化来”的具体设计的时候需要根据企业自身业务情况找到最适合自己当下的数仓架构。 了解更多数据仓库与数据集成关干货内容请关注FineDataLink官网 免费试用、获取更多信息点击了解更多体验FDL功能 往期推荐 【大数据】什么是数据湖一文揭示数据湖的本质-CSDN博客 金蝶API取数JSON解析FDL助力高效数据处理-CSDN博客 业务场景中的数仓调度-CSDN博客
http://www.dnsts.com.cn/news/14790.html

相关文章:

  • 网站创建人网站设计学什么专业
  • 合川网站优化门户设计方案
  • 东莞阿里网站设计智能建站公司
  • 长沙公司建设网站宁波自适应网站建设
  • 中山网站建设乐云seo模板中心美食网站开发详细设计
  • 中建南方建设集团网站图书网站建设策划书
  • 网站搜索引擎优化推广有什么平台可以发布推广信息
  • 网站开发开题报告ppt怎样建设购物网站
  • 厦门网站建设公司大型网站开发项目合同
  • 苏州嘉盛建设工程有限公司网站二级域名大全
  • 学网站建设需要用哪几个软件软件商城官网
  • 网站图片有什么要求吗安卓优化大师最新版下载
  • 有哪些做的比较精美的网站网站建设时如何选择合适的服务器
  • 搞笑网站模板网页游戏排行榜前十2023
  • 网站加速器免费一流的铁岭做网站公司
  • 八亿免费wap自助建站网页制作题用什么软件
  • html网站设计作品婚纱礼服外贸网站
  • 网站手机模板和pc模板要分开做怎么停止网站
  • 高质量的佛山网站模板动漫设计就业率高吗
  • 动易学校网站模板淘宝网的网站设计特色
  • 小型的做网站公司从哪里接的项目苏州seo关键词优化外包
  • 跟我学做纸艺花网站wordpress主机购买
  • 内蒙古住房与城乡建设部网站qq邮箱怎么在手机qq上打开wordpress
  • 深圳珠宝网站设计影楼网站推广
  • 国内优秀网站案例广告牌模板图片
  • 设置网站语言wordpress 自动链接
  • 成都哪家做网站做的好学校网站建设评比
  • 南昌 定制网站网络游戏对青少年的危害
  • 如何上传网站产品包装设计创意
  • 建站工具 开源自己开一个网站要多少钱