当前位置: 首页 > news >正文

中企动力双语网站城桥微信网站设计制作

中企动力双语网站,城桥微信网站设计制作,德庆网站建设,网络技术开发包括哪些内容一、基本概念 **1. RDS#xff08;RAW DATA STORES#xff0c;原始数据存储#xff09;** RDS作为原始数据存储层#xff0c;用于存储来自各种源头的未经处理的数据。这些数据可能来自企业内部的业务系统、外部数据源或各种传感器等。RDS确保原始数据的完整性和可访问性RAW DATA STORES原始数据存储** RDS作为原始数据存储层用于存储来自各种源头的未经处理的数据。这些数据可能来自企业内部的业务系统、外部数据源或各种传感器等。RDS确保原始数据的完整性和可访问性为后续的数据处理和分析提供原始素材。 **2. ODSOperational Data Store操作数据存储** ODS操作性数据是数据仓库架构中的重要组成部分。它位于数据源系统和数据仓库的数据集市之间,主要用于存储从各个业务系统抽取的原始数据。作为数据库到数据仓库的一种过渡ODS的数据结构一般与数据来源保持一致便于减少ETL的工作复杂性而且ODS的数据周期一般比较短。ODS的数据最终流入DW。 ODS位于RDS之后用于存储从RDS中提取出来的、经过初步整合的数据。ODS通常用于存储来自多个操作型系统的数据如ERP、CRM等。它的主要作用是为数据仓库提供结构化、整合后的数据作为后续数据处理和分析的基础。 ODS存储的是当前的数据情况给使用者提供当前的状态提供即时性的、操作性的、集成的全体信息的需求。ODS作为数据库到数据仓库的一种过渡形式能提供高性能的响应时间。ODS中的数据是实时值而数据仓库的数据却是历史值。 2.1 ODS的特点 ODS层的主要特点包括: 面向主题: 数据按照业务主题进行组织粒度细: 保留原始数据的细节级别实时性强: 数据更新频率较高,通常为准实时或近实时数据冗余: 保留历史数据,支持数据回溯 2.2 ODS系统的作用 一般在带有ODS的系统体系结构中ODS都具备如下几个作用 1 在业务系统和数据仓库之间形成一个隔离层。  2 转移一部分业务系统细节查询的功能。在数据仓库建立之前大量的报表、分析是由业务系统直接支持的在一些比较复杂的报表生成过程中对业务系统的运行产生相当大的压力。ODS的数据从粒度、组织方式等各个方面都保持了与业务系统的一致那么原来由业务系统产生的报表、细节数据的查询自然能够从ODS中进行从而降低业务系统的查询压力。 3 完成数据仓库中不能完成的一些功能。 一般来说带有ODS的数据仓库体系结构中DW层所存储的数据都是进行汇总过的数据和运营指标并不存储每笔交易产生的细节数据但是在某些特殊的应用中可能需要对交易细节数据进行查询这时就需要把细节数据查询的功能转移到ODS来完成而且ODS的数据模型按照面向主题的方式进行存储可以方便地支持多维分析等查询功能。 **3. TDSTRANSFORMED DATA STORES转换后的数据存储** TDS在ODS之后负责对数据进行清洗、转换和整合以满足特定的业务需求或分析需求。在TDS中数据经过一系列的处理操作如去除重复数据、填充缺失值、转换数据类型等以生成更加准确、一致和有用的数据集。 **4 .数据仓库DW 4.1 概述 数据仓库(Data Warehouse)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合用于支持管理决策。DW保持着所有的从ODS到来的数据并长期保存而且这些数据不会被修改。DW中的数据实际存储在分布式文件系统中如HDFS。如果想要删除数据一般会在分布式文件系统中进行操作。而由于效率问题数据仓库一般只读取数据不直接对数据进行修改。 1 面向主题(Subject Oriented)操作型数据库的数据组织 面向事务处理任务各个业务系统之间各自分离而数据仓库中的数据是按照一定的主题域进行组织的。 2 集成的(Integrated)数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的必须消除源数据中的不一致性以保证数据仓库内的信息是关于整个企业的一致的全局信息。 3 相对稳定的(Non-Volatile) 数据仓库的数据主要供 企业决策分析之用所涉及的数据操作主要是数据查询一旦某个数据进入数据仓库以后一般情况下将被长期保留也就是数据仓库中一般有大量的查询操作但修改和删除操作很少通常只需要定期的加载、刷新。 4 反映历史变化(Time Variant) 数据仓库中的数据通常包含历史信息系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到各个阶段的信息通过这些信息可以对企业的 发展历程和未来趋势做出定量分析和预测。 4.2 数据仓库的特征 特征有 1效率足够高要对进入的数据快速处理 2数据质量高数据仓库是提供很多决策需要的数据支撑DW的数据应该是唯一的具有权威性的数据企业的所有系统只能从DW取数据所以需要定期对DW里面的数据进行质量审保证DW里边数据的唯一、权威、准确性。 3扩展性企业业务扩展和降低企业建设数据仓库的成本考虑 4面向主题数据仓库中的数据是按照一定的主题域进行组织的每一个主题对应一个宏观的分析领域数据仓库排除对决策无用的数据提供特定主题的简明视图 5数据仓库主要提供查询服务并且需要查询能够及时响应 6DW的数据也是只允许增加不允许删除和修改数据仓库主要是提供查询服务删除和修改在 分布式系统 数据仓库是一个过程而不是一个项目 数据仓库系统是一个信息提供平台从业务处理系统获得数据主要以星型模型和雪花模型进行数据组织并为用户提供各种手段从数据中获取信息和知识。 从功能结构划分数据仓库系统至少应该包含数据获取(Data Acquisition)、数据存储(Data Storage)、数据访问(Data Access)三个关键部分。 **5. 数据集市DM 数据集市(Data Mart) ,为了特定的应用目的或应用范围而从数据仓库中独立出来的一部分数据也可称为部门数据或主题数据。 面向应用。在数据仓库的实施过程中往往可以从一个部门的数据集市着手以后再用几个数据集市组成一个完整的数据仓库。 需要注意的就是在实施不同的数据集市时同一含义的字段定义一定要相容这样再以后实施数据仓库时才不会造成大麻烦。数据集市以某个业务应用为出发点而建设的局部DW,DW只关心自己需要的数据不会全盘考虑企业整体的数据架构和应用。 特征有 1DM结构清晰针对性强扩展性好因为DM仅仅是单对一个领域而建立容易维护修改 2DM建设任务繁重公司有众多业务每个业务单独建立表 3DM的建立更多的消耗存储空间单独一个DM可能数据量不大但是企业所有领域都建立DM这个数据量就会增加多倍 6.如何能搭建一个体系既能支持战略决策使用的数据仓库数据又能兼容业务快速的变化和运营产品人员日常需求的ODS数据 数据仓库和ODS并存方案经过调研发现大体上有三种解法 1业务数据 ODS 数据仓库 2DB ODS 优点结构简单。一般的初创数据分析团队都是类似的结构比如我们部门就应该归结到这一范畴 缺点这样所有数据都归结到ODS长期数据决策分析能力差软硬件成本高模块划分不清晰通用性差。 3数据仓库和ODS并行 引用自ODS、DW、DM - 知乎 (zhihu.com)  数仓分层ODS、DWD、DWS、DWT、ADS和数仓建模_ods,dwd,dws,ads-CSDN博客 二、.数据仓库分层 1 数据分层思想 ​数据分层每个企业根据自己的业务需求可以分成不同的层次但是最基础的分层思想理论上数据分为三个层数据运营层、数据仓库层和数据服务层。基于这个基础分层之上添加新的层次来满足不同的业务需求。 ​ 2 数据分层的好处 1清晰数据结构 每个数据分层都具有明确定义的作用范围和职责使得在使用表时更容易定位和理解。 2减少重复开发 通过规范数据分层可以开发一些通用的中间层数据从而极大地减少重复计算的工作。 3统一数据口径 数据分层提供了统一的数据出口使得对外输出的数据口径更为一致。 4复杂问题简单化 通过将复杂任务分解为多个层次来完成每一层解决特定的问题从而简化了整体任务的复杂性。 3 业界常见数仓分层架构 简拼 全称    说明ODSOperation Data Store操作数据存储层用于存储来自业务系统的原始数据。从数据粒度上看ODS层是粒度最细的数据层。DWDData Warehouse Detail数据仓库明细层用于存储经过清洗和加工的明细数据。这层数据粒度通常和ODS的粒度相同不同的是该层的数据质量更高字段更适合统计的需要等。同时为了提高数据明细层的易用性该层会采用一些维度退化手法将维度退化至事实表中减少事实表和维表的关联。DWM Data WareHouse Middle可选 数据中间层会在DWD层的数据基础上对数据做轻度的聚合操作生成一系列的中间表提升公共指标的复用性减少重复加工。 DWSData Warehouse Summary数据仓库汇总层又称数据集市或宽表用于存储汇总后的数据。从数据粒度来说这层的数据是轻度汇总级的数据已经不存在明细数据了。按照业务划分如流量、订单、用户等生成字段比较多的宽表用于提供后续的业务查询OLAP分析数据分发等。ADSApplication Data Service数据应用服务层为应用系统提供数据服务。从数据粒度来说是高度汇总的数据。面向用户应用和分析需求包括前端报表、分析图表、KPI、仪表盘、OLAP、专题等分析DIMDimension 公共维度层由维度表构成基于维度建模理念建立整个企业的一致性维度。 高基数维度数据一般是用户资料表、商品资料表类似的资料表。数据量可能是千万级或者上亿级别。 低基数维度数据一般是配置表比如枚举值对应的中文含义或者日期维表。数据量可能是个位数或者几千几万。 TMP可选DWTMP层是数据仓库中的一个特定层次专门用于存储数据仓库各层计算过程中产生的临时表。 4 案例根据架构设计数据体系 举个例子说明一下如下图可以认为是一个电商网站的数据体系设计。我们暂且只关注用户访问日志这一部分数据。 在ODS层中由于各端的开发团队不同或者各种其它问题用户的访问日志被分成了好几张表上报到了我们的ODS层。 为了方便大家的使用我们在DWD层做了一张用户访问行为天表在这里我们将PC网页、H5、小程序和原生APP访问日志汇聚到一张表里面统一字段名提升数据质量这样就有了一张可供大家方便使用的明细表了。 在DWM层我们会从DWD层中选取业务关注的核心维度来做聚合操作比如只保留人、商品、设备和页面区域维度。类似的我们这样做了很多个DWM的中间表 然后在DWS层我们将一个人在整个网站中的行为数据放到一张表中这就是我们的宽表了有了这张表就可以快速满足大部分的通用型业务需求了。 最后在APP应用层根据需求从DWS层的一张或者多张表取出数据拼接成一张应用表即可。 5 不同的层次中用到的计算引擎和存储系统 6 如何构建一个高效的数据仓库分层体系 首先 企业需要明确业务需求和数据特点确定分层的粒度和层次结构。其次 选择合适的存储技术和工具确保各层次数据的高效存储和访问。最后 建立完善的数据管理流程和规范确保数据的准确性和安全性。 数据分层的划分时我从以下几个角度进行思考 对应用的支持 从这个角度来看我们期望越靠上层次越能够友好地支持应用。例如APP层基本上是为应用专门设计的易于理解。相较之下DWS层可能会有一些理解成本而DWM和DWD层则更加复杂因为它们可能涉及多个维度并需要进行复杂的计算才能满足需求。 能力范围 我们希望80%的需求可以由20%的表来支持。换言之大部分80%以上的需求都可以使用DWS层的表来支持DWS无法支持的需求可以借助DWM和DWD层的表而仅有极少部分的数据需求可能需要从原始日志中提取。结合第一点我们希望以对应用非常友好的方式来支持80%的需求而不是直接将原始日志暴露给应用方。 数据聚合程度 我们希望上层数据的聚合程度越高越好。以ODS和DWD的数据为例它们基本上保留了原始日志的粒度没有进行任何聚合操作。DWM进行了轻度的聚合仅保留了通用的维度而DWS则进行了更高级的聚合操作可能只保留了一到两个能够完整描述当前主体的维度。从这个角度来看我们可以理解为我们是根据数据的聚合程度来划分数据层次的。 参考自数据仓库内容分享(六)数据仓库层次化设计_数据明细层-CSDN博客 三、问题 4.1 DWS 与 DWD 问答一 dws 和 dwd 的关系 问dws 和dwd 是并行而不是先后顺序? 答并行的dw 层 问那其实对于同一个数据这两个过程是串行的? 答dws 会做汇总dwd 和 ods 的粒度相同这两层之间也没有依赖的关系 问对呀那这样 dws 里面的汇总没有经过数据质量和完整度的处理或者单独做了这种质量相关的处理为什么不在 dwd 之上再做汇总呢?我的疑问其实就是dws的轻度汇总数据结果有没有做数据质量的处理? 答ods 直接到 dws 就好没必要过 dwd我举个例子你的浏览商品行为我做一层轻度汇总就直接放在 dws 了。但是你的资料表要从好多表凑成一份我们从四五份个人资料表中凑出来了一份完整的资料表放在了 dwd 中。然后在 app 层我们要出一张画像表包含用户资料和用户近一年的行为我们就直接从dwd中拿资料 然后再在 dws 的基础上做一层统计就成一个app表了。当然这不是绝对dws 和 dwd 有没有依赖关系主要看有没有这种需求。 4.2 ODS与DWD区别 问还是不太明白 ods 和 dwd 层的区别有了 ods 层后感觉 dwd 没有什么用了。 答嗯我是这样理解的站在一个理想的角度来讲如果 ods 层的数据就非常规整基本能满足我们绝大部分的需求这当然是好的这时候 dwd 层其实也没太大必要。 但是现实中接触的情况是 ods 层的数据很难保证质量毕竟数据的来源多种多样推送方也会有自己的推送逻辑在这种情况下我们就需要通过额外的一层 dwd 来屏蔽一些底层的差异。 问我大概明白了是不是说 dwd 主要是对 ods 层做一些数据清洗和规范化的操作dws 主要是对 ods 层数据做一些轻度的汇总? 答对的可以大致这样理解。 4.3 app层干什么的 问答三app 层是干什么的? 问感觉数据集市层是不是没地方放了各个业务的数据集市表是应该在 dwd 还是在 app? 答这个问题不太好回答我感觉主要就是明确一下数据集市层是干什么的如果你的数据集市层放的就是一些可以供业务方使用的宽表表放在 app 层就行。如果你说的数据集市层是一个比较泛一点的概念那么其实 dws、dwd、app 这些合起来都算是数据集市的内容。 问那存到 Redis、ES 中的数据算是 app层吗? 答算是的我个人的理解app 层主要存放一些相对成熟的表能供业务侧使用的。这些表可以在 Hive 中也可以是从 Hive 导入 Redis 或者 ES 这种查询性能比较好的系统中。 四、数据模型的评价标准 数据模型建设的怎么样极度依赖规范设计如果代码风格是“千人千面”那么恐怕半年下来业务系统就没法看了。没有什么比“数据系统”更看重“法制”了规范体系不仅能保障数据建设的一致性也能够应对业务交接的情况更能够为自动化奠定基础。 业务过程清晰ODS就是原始信息不修改DWD面向基础业务过程DIM描述维度信息DWS针对最小场景做指标计算ADS也要分层面向跨域的建设和面向应用的建设指标可理解按照一定业务事务过程进行业务划分明细层粒度明确、历史数据可获取汇总层维度和指标同名同义能客观反映业务不同角度下的量化程度核心模型相对稳定如果业务过程运行的比较久过程相对固定就要尽快下沉到公共层形成可复用的核心模型高内聚低耦合各主题内数据模型要业务高内聚避免在一个模型耦合其他业务的指标造成该模型主题不清晰和性价比低。
http://www.dnsts.com.cn/news/144191.html

相关文章:

  • 网站短期电脑培训班学费php网站开发指导教材 文献
  • 海洋网站建设怎么样做推广哪个平台好
  • 那个网站的系统好做dj音乐网站
  • asp.ney旅游信息网站下载 简洁外贸网站建设980
  • 邯郸市城乡住房建设局网站教育行业网站建设审批
  • 河南新蔡有做网站建设的吗seo网络推广哪家专业
  • 做镜像网站违法微企免费网站建设
  • 福州网站设计要多少钱自贡电子商务网站建设
  • 广州网站建设建网站流程的费用
  • 江苏扬州建设局网站天河建设网站公司
  • 绍兴建设局网站首页seo专业为网站建设
  • 开封景区网站建设项目方案企业信息查询系统官网广东
  • 做饰品一般用什么网站做首饰数据库 导入 wordpress 错误
  • 如何做网站的源码wordpress图片变形
  • 静态网站的好处就是安全性好从而怎样做号网站优化
  • 网站界面设计的原则工信部网站域名查询
  • 网站建设明细报价网站的静态页面
  • 查找网站域名网站建设易网
  • 建站快车的应用场景pc网站 手机网站 微信网站 上海
  • 宁波建设工程检测行业协会网站公司企业管理
  • 外贸网站空间哪个好网页设计制作心得
  • 怎么找网站做公示抚州专业的企业网站建设公司
  • 微分销平台到底哪个比较好天津seo公司网站
  • 商城类网站建设步骤网络系统的价值跟用户数量成正比
  • 小企业怎么建网站平台wordpress文章不显示摘要
  • 代理登录网站山东建设工程信息网站
  • 美发企业网站模板设计网页英语
  • 建设行政管理部门网站seo优化技巧
  • 腾讯云做网站需要报备app推广渠道
  • 网站注册后能不能注销网站规划与开发技术