当前位置: 首页 > news >正文

孝义做网站的公司步骤一

孝义做网站的公司,步骤一,东莞专业微网站建设价格低,做一家影视网站赚钱吗试卷组成 第一章图 第二章图 第三章图 第四章图 第五章图 第六章图 第九章图 第一章 DW与DM概述 #xff08;特点、特性#xff09; DB到DW 主要特征 #xff08;1#xff09;数据太多#xff0c;信息贫乏#xff08;Data Rich#xff0c; Information Poor)。 特点、特性 DB到DW 主要特征 1数据太多信息贫乏Data Rich Information Poor)。 2异构环境数据的转换和共享。不同数据库数据结构不一样如何整合 3利用数据进行事务处理转变为利用数据支持决策。 总结D多异构事决 好多DDB和DW发生争执给他们异构体事情解决 演变4点 1DB用于事务处理DW用于决策分析。 2DB保持事务处理的当前状态。 DW既保存过去的数据又保存当前的DB中的数据。 随业务的变化一直更新保存当前数据。 不随时间变化而变化保留历史数据和当前数据。 3DW的数据是大量DB的集成。 4对DB的操作比较明确操作数据量少。 对DW操作不明确通过某种算法操作数据量大。 总结事决状态集成操作 想要事情解决D保持良好状态集成精力施以操作 OLTP到 OLAP 联机事务处理 (On Line Transaction Processing,OLTP 概念用户的数据可以立即传送到计算中心进行处理短时间内给出处理结果。 实时系统(Real Time System) 联机分析处理 On Line Analytica ProcessingOLAP 概念多维数据库和多维分析 元数据 Meta Data 什么是元数据 描述数据的数据(Data About Data 为什么研究 数据越多越需要能对数据进行描述说明的数据。 重要性数据仓库中数据的描述数据字典 元数据的分类 关于数据源的元数据 对不同平台上的数据源的物理结构和含义的描述。提示我们如何将数据转换到DW中关于数据模型的元数据 描述了DW中有什么数据以及数据之间的关系。关于DW映射的元数据 是数据源与DW数据间的映射。 获取数据的第一步元数据反映DW中的数据项从哪个数据源抽取的经过哪些ETL 关于DW使用的元数据。DW中信息使用情况的描述。 总结D源模W映用物含关系映射使用 元数据的分类查看原魔应用 DW特点6 面向主题 每一个主题基本对应一个宏观的分析领域。对什么决策集成的 对不同的数据来源进行统一数据结构和编码。稳定的 大量的历史数据只进不出随时间变化长时间数据量很大软、硬件要求较高 巨大的硬件平台 并行的数据库系统 特点总结题集稳时数要求 DW提及问题时要数要求 本书核心 数据仓库是为辅助决策而建立的 DM 知识发现 Knowledge Dicovery in DatabaseKDD从数据中发现有用知识的整个过程。主要算法是归纳学习算法。KDD过程中的一个特定步骤它用专门算法从数据中抽取知识。 DM与OLAP比较 OLAP多维分析切片、切块、钻取操作。辅助决策。DM任务在于聚类如神经网络聚类、分类如决策树分类、预测等。 确定一个高价值的客户或可能离开的客户特征。 第二章 DW原理 DW结构包含哪几类数据 5历当轻高元 数据集市 Data Marts 概念更小、更集中、具特定应用的DW。 特性规模小、特定应用、面向部门、快速实现、投资快速回收、可升级到完整DW。 分类 独立数据集市 (Dependent Data Mart)         数据来源直接来源于各生产系统 从属数据集市 (Independent Data Mart)         数据来源直接来自中央DW 数据集市与DW差别 主题 DW面向企业范围。 数据集市面向某一特定部门。数据详细程度 DW非常详细 数据集市低概要多数据组织 DW第三范式等。 数据集市星型模型。 总结题详细组织企部高低三星 主题公园的D详细组织起步高低的三星 DW系统结构 由数据仓库DW、仓库管理和分析工具三部分组成。 1、仓库管理包括什么 4部分 1数据建模是建立DW的数据模型Data Model DW数据模型按设计过程分类 概念数据模型 最高层次的数据模型 它定义了组织的数据仓库的业务概念和需求。 逻辑数据模型 概念数据模型的具体化 它描述了数据元素之间的关系但不涉及存储细节。 物理数据模型 逻辑数据模型的实现 它详细描述了数据在数据库中的存储方式。 总结概逻物需求关系存储 盖螺屋rrs 2数据抽取、转换、装载 ETL Extract、Transform、Load 70%工作量 抽取Extract 第一步从各种数据源中收集数据。 批量实时提取数据。 转换Transform 核心步骤将原始数据转换成适合DW格式的数据。 转换过程 数据清洗 去除错误和不一致的数据 数据集成 合并来自不同源的数据 数据聚合 汇总数据以减少数据量 数据映射 将数据映射到数据仓库模型 ...... 转换过程确保数据的一致性、准确性并满足数据仓库的业务需求。 装载Load 最后一步涉及将转换后的数据加载到DW中。 总结ETL收集数据转格式加载DW 3元数据 3功能DW字典指导ETL工作指导用户使用DW。 4系统管理 4部分数据管理、性能监控、存储器管理、安全管理。 总结数性存安 dpss 2、分析工具 1查询工具可视化工具 2多维分析工具OLAP工具 3数据挖掘DM工具 4C/S工具 DW运行结构 典型的客户/服务器C/SDW应用的三层C/S结构 C/S(OLAP,DW) 有个公用OLAP层工作效率更高 DW的数据模型 多维数据模型 星型模型 由“事实表”大表以及多个“维表”小表所组成。 雪花模型 对星型模型的维表进一步层次化原来的各维表可能被扩展为小的事实表形成一些局部的“层次”区域。 星网模型 将多个星型模型连接起来形成网状结构。 第三范式 传统DB设计理论 减少数据冗余 优势 星型模型 多维数据分析时速度很快 但是增加维度将是很困难的事情。 第三范式 海量数据如TB级,大量的动态业务分析 第三章 OLAP 联机分析处理 概念 定义 OLAP是共享多维信息的快速分析。 4个特征 1、快速性 2、可分析性 3、多维性 4、信息性 总结快可多信 快速的多维分析信息值得信赖 特点 1.线性On Line由网络上的C/S结构完成。 2.多维分析OLAP的核心所在。 准则 主要4条 1多维数据分析 2客户/服务器结构 3多用户支持 4一致的报表性能等。 数据维数和数据的综合层次增加时 提供的报表能力和响应速度不应该有明显的降低。 (即便D量维度增加速度不应该下降) OLAP的数据模型 分类 MOLAP数据模型 Multidimensional Online Analytical Processing 基于多维数据库存储方式建立的OLAP 表现为“超立方”结构采用类似于多维数组的结构。 ROLAP数据模型 Relational Online Analytical Processing 是基于关系数据库的OLAP。 是一个平面结构用关系数据库表示多维数据时采用星型模型。 比较 1.数据存取速度MOLAP的响应速度快 M R需要转化SQL语句 2.数据存储的容量 ROLAP存储容量上没有限制 R M立体方式存放数据数据量级不大 3.多维计算的能力MOLAP能够支持高性能计算 M R无法多行/维计算 4.维度变化的适应性ROLAP对于维表的变更有很好的适应性 R M增维需重建DB 5.数据变化的适应性 ROLAP对于数据变化的适应性高 ) R M在数据频繁变化时需要大量重新计算 6.软硬件平台的适应性(ROLAP适应性很好 ) R 7.元数据管理 均无成形标准。 总结as计维变适管多关多关关关无 存计为多其余为关 多维数组的表示 维1维2……维n变量 一个4维的结构即产品地区时间销售渠道销售额。元组 多维数据的显示 多维数据的显示只能在平面上展现出来。 多维数据的分析视图 平面显示多维数据利用行、列和页面三个显示组表示。页面行列指标维 页面商店3商店维 行月份时间维1月2月3月 列产品产品维上衣裤子帽子 指标维固定成本直接销售 多维数据分析的基本操作分别是怎么执行的 切片、切块、旋转、钻取 1.切片 选定多维数组的一个二维子集的操作。 2. 切块 多维数组的某个维上选定某一区间的维成员的操作。 选定多维数组的一个三维子集的操作。 3. 钻取 维度的细分。 向上钻取drill up 向上钻取获取概括性的数据。 缩小地图区-市-省-国 向下钻取drill down 向下钻取是使用户在多层数据中能通过导航信息而获得更多的细节性数据。 放大地图国-省-市-区 4.旋转 得到不同视角的数据。 相当于平面数据将坐标轴旋转。 总结片块上下转二三概细多视角。 数据立方体 概述实际为数据仓库结构图中的综合数据层轻度和高度。 多维数据集的属性分类 维属性 度量属性 典型的压缩型数据立方体 1冰山立方体 数据的筛选在冰山立方体的生成计算中仅聚集高于或低于某个阈值的子立方体。 2紧凑数据立方体 用一条数据来代表之前表中的多条数据元组压缩如产品地区时间销售渠道销售额 3外壳片段立方体 4流式数据立方体 第四章 DW的决策支持 DW用户 信息查询者 业务层面 user 是使用DW的主要用户。 特点 以一种可预测的、重发性的方式使用数据仓库平台。 作用 使用数据仓库能发现目前存在的问题。 方法 创建数据阵列 预连接表格 预聚集数据 聚类数据 知识探索者 分析决策 user 典型的DM者。 特点 有一个完全不可预测的、非重复性的数据使用模式。 作用 发现问题并找出原因。 方法 创建单独的探索仓库不影响数据仓库的常规用户。 “标识技术”数据压缩提高数据分析速度。 使用模型帮助决策分析。 采用数据挖掘工具来获取商业知识。 总结比较 user DWDM 特点 可预测重发性不可预测和重复 作用 找到问题问题和原因 第五章 DM原理了解即可 KDD 概念从数据中发现有用知识的整个过程。 过程 数据准备、DM、结果评估 数据准备的三个步骤 数据选择数据预处理数据转换 DM KDD过程中的一个特定步骤它用专门算法从数据中抽取模式patterns。 按照DM任务采取不同方法 聚类方法 结果未知 在没有类别的数据中按照”距离“远近聚集若干类别。 典型方法k均值聚类算法统计分析方法机器学习方法神经网络方法等 分类方法 结果已知 对有类别的数据找出各类别的描述知识。 典型方法ID3、C4.5、IBLE等分类算法 总结 有无类别 结果评估 数据质量好坏的两个影响因素 DM技术的有效性 挖掘数据的质量和数量 总结技术和数据 DM任务和分类 DM任务 1关联分析 两个或多个数据项的取值之间重复出现且概率很高时它就存在某种关联可以建立起这些数据项的关联规则。 2时序模式 通过时间序列搜索出重复发生概率较高的模式 3聚类 在没有类的数据中按“距离”概念聚集成若干类。 距离 同一类别中个体之间的距离较小 而不同类别上的个体之间的距离偏大 4分类 在聚类的基础上对已确定的类找出该类别的概念描述它代表了这类数据的整体信息。 类的内涵描述 特征描述 对类中对象的共同特征的描述。 辨别性描述 对两个或多个类之间的区别的描述 5偏差检测 从数据分析中发现异常情况 6预测 利用历史数据找出变化规律建立模型并用此模型来预测未来数据的种类特征等 什么是聚类和分类 决策树知识 ps在其基础上考计算题 信息熵和信息增益 决策树是一种常用的机器学习算法用于分类和回归任务。 基本概念 决策树通过一系列的问题将数据分割成不同的分支最终达到一个结论或决策。 构建过程 从根节点开始选择一个特征和阈值进行分割递归地在子节点上重复这个过程直到满足停止条件。 特征选择 特征选择是决策树构建中的关键步骤用于决定在每个节点上使用哪个特征进行分割。常见的特征选择方法包括信息增益、信息增益率和基尼不纯度。 第六章 信息论方法 计算题 决策树方法 了解即可 决策树是一种知识表示形式它是对所有样本数据的高度概括。 决策树如ID3、C4.5方法是把信息量最大的属性作为树或子树的根结点属性的取值作为分枝。 ID3决策树 结点 根结点 是所有样本中信息量最大的属性。 中间结点 是该结点为根的子树所包含的样本子集中信息量最大的属性。 叶结点 是样本的类别值。 信息熵和信息增益 信息传递系统 信道模型 发送端信源 接收端信宿 连接两者的通道信道 概念 1、信息熵 HU 也称为先验熵 先验不确定性 先验不确定性不能全部被消除只能部分地消除 接收端信宿不确定发送端信源状态。 是信源输出前的平均不确定性也称先验熵。 总结 P(U)所有例子中的正例和反例在总例的占比 H(U)-占比log占比二者相加 2、条件熵HU/V 也称为后验熵 后验不确定性 通信结束之后信宿仍然具有一定程度的不确定性。 后验不确定性总要小于先验不确定性 HU/V HU 相等表示信宿没收到信息。 后验不确定性为0表示信宿收到全部信息。 总结 P(V)属性某一取值在总例的占比 P(U/V)属性某一取值的正反例占比 H(U/V)-总例占比×属性取值占比log属性取值占比之和之和 3、信息量用互信息来表示也称为信息增益先验熵-后验熵 IUVHU HU/V 信息是用来消除随机不确定性的度量。 总结 计算所有属性的互信息量I 4、建决策树树根和分支 树根 选择互信息量I最大的特征值 分支 划分特征子集F 5、递归建树 继续求剩余特征的互信息量找互信息量最大的一个作为分支的根结点向下分支最后标记正反例分类 计算 第九章 遗传算法和计算智能 了解 遗传算法 Genetic Algorithms,GA 是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化搜索算法。 遗传算子 选择 (Selection) 依据每个染色体的适应值大小适应值越大被选中的概率就越大其子孙在下一代产生的个数就越多。 选择操作是建立在群体中个体的适应值评估基础上的目前常用的选择算子有适应值比例法、最佳个体保存法、期望值方法等。 交叉重组 (Crossover) 通过染色体重组来产生新一代染色体。 变异 (Mutation) 变异增加了遗传算法找到接近最优解的能力。 变异就是以很小的概率随机地改变字符串某个位置上的值。把某一位的内容进行变异。
http://www.dnsts.com.cn/news/141985.html

相关文章:

  • 网站建设方案申请wordpress 电子书
  • 做视频网站成本高吗怎么做农家乐联盟网站
  • wordpress站内搜索统计如何做网站的薪酬调查
  • 网站seo优化方案做外国的网站卖东西
  • 如何做网站的的关键词机械加工网论坛
  • 快速企业建站网站运营与公司简介
  • 北海做网站wordpress超cpu
  • 深圳游戏网站开发建站之星官网登陆
  • 个人网站备案 照片网站备案是每年一次吗
  • 济南网站建设安卓版博达网站建设怎么建立下载
  • 成都网站建设哪些公司好wordpress303
  • 做加工都在哪个网站推广网页设计作业怎么打包
  • 怎么用源码搭建网站中视频自媒体平台注册
  • 做网站设计都需要什么软件自己做商务网站有什么利弊
  • 茌平网站制作焦作做网站公司
  • 广州网站建设圣矢jsp网站开发实例pdf
  • 国内网站设计经典案例行业网站特点
  • 辽宁自助网站建设价格兖州网站制作
  • 怎么查网站制作空间有效期怎么在百度做免费推广
  • 网站建设文案策划线上营销平台
  • 网上有女的叫你建网站怎么样做英文网站
  • 做相册的网站dw黄冈贴吧
  • 南宁工程建设网站有哪些建立本机网站
  • 合肥专业网站制作设计网站策划书撰写
  • 温州建设管理处网站思维导图在线制作网站
  • 网站全局参数设置前端代码练习网站
  • 现在建设网站都用什么软件下载太和县建设银行网站
  • 网站侵权 做网站有责任吗离线发wordpress
  • 知乎 网站开发工具接网站开发项目平台
  • 网站新闻打不开北京sem