html网站设计实验报告,太原小程序开发定制,东莞南城招聘网,成立一个公司需要哪些流程数据分析概述#xff1a;数据获取--探索分析与可视化--预处理--分析建模--模型评估 数据分析含义#xff1a;利用统计与概率的分析方法提取有用的信息#xff0c;最后进行总结与概括 一、数据获取 实用网站#xff1a;kaggle 阿里云天池 数据仓库#xff1a;将所有业务数据…数据分析概述数据获取--探索分析与可视化--预处理--分析建模--模型评估 数据分析含义利用统计与概率的分析方法提取有用的信息最后进行总结与概括 一、数据获取 实用网站kaggle 阿里云天池 ·数据仓库将所有业务数据汇总处理构成数据仓库DW ·全部事实记录 ·部分维度与数据的整理数据集市DM ·监测与抓取爬虫 ·填写、埋点、日志 ·用户填写信息 ·APP或网页埋点特定流程的信息记录点页面统计、统计操作行为 ·操作日志 ·计算 ·通过已有数据计算
二、探索分析与可视化 单因子和可视化 ·理论基础 ···集中趋势均值、中位数与分位数、众数 ····四分位数计算方法Q1的位置n1*0.25 n为数据的个数 Q2的位置n1*0.5 Q3的位置n1*0.75 ···离中趋势标准差、方差--σ的值越大表示数据越离散σ越小表示数据越聚拢 ···数据分布偏态与峰态、正态分布与三大分布 ····偏态系数S与峰态系数K--均值中位数--正偏反之为反偏 ···抽样理论抽样误差、抽样精度 ·数据分类 ··定类类别 ··定序顺序 ··定距间隔 ··定比比率 ·单属性分析 ··异常值分析 ···连续异常值 ···离散异常值 ···知识异常值 ··对比分析 ···绝对数比较 ···相对数比较--结构相对数、比例相对数、比较相对数、强调相对数 ···对比维度--时间维度、空间维度、经验与计划 ··结构分析 ···静态 ···动态 ··分布分析 ···直接获得概率分析 ···是不是正态分布 ···极大似然