如何免费建设自己稳定的网站,内蒙古呼和浩特市邮编,微信盲盒小程序搭建,邢台网站建设行情文章目录前言一、准备二、sweetviz 基本用法1.引入库2.读入数据3.调整报告布局总结前言
Sweetviz是一个开源Python库#xff0c;它只需三行代码就可以生成漂亮的高精度可视化效果来启动EDA(探索性数据分析)。输出一个HTML。
如上图所示#xff0c;它不仅能根据性别、年龄等…
文章目录前言一、准备二、sweetviz 基本用法1.引入库2.读入数据3.调整报告布局总结前言
Sweetviz是一个开源Python库它只需三行代码就可以生成漂亮的高精度可视化效果来启动EDA(探索性数据分析)。输出一个HTML。
如上图所示它不仅能根据性别、年龄等不同栏目纵向分析数据还能对每个栏目做众数、最大值、最小值等横向对比。
所有输入的数值、文本信息都会被自动检测并进行数据分析、可视化和对比最后自动帮你进行总结是一个探索性数据分析的好帮手。
一、准备
开始之前你要确保Python和pip已经成功安装在电脑上如果没有可以访问这篇文章超详细Python安装指南 进行安装。
(可选1) 如果你用Python的目的是数据分析可以直接安装AnacondaPython数据分析与挖掘好帮手—Anaconda它内置了Python和pip.
(可选2) 此外推荐大家用VSCode编辑器它有许多的优点Python 编程的最好搭档—VSCode 详细指南。
请选择以下任一种方式输入命令安装依赖
Windows 环境 打开 Cmd (开始-运行-CMD)。MacOS 环境 打开 Terminal (command空格输入Terminal)。如果你用的是 VSCode编辑器 或 Pycharm可以直接使用界面下方的Terminal.
pip install sweetviz
二、sweetviz 基本用法
1.引入库
sweetviz 使用的原理是使用一行代码生成一个数据报告的对象其中my_dataframe是pandas中的DataFrame一种表格型数据结构
import pandas as pd
import sweetviz as sv# 读取数据
my_dataframe pd.read_csv(../ImpartData/iris.csv)
# 分析数据
my_report sv.analyze(my_dataframe)
# 生成报告
my_report.show_html()执行完成后会在当前文件夹下生成一个HTML的报告文件 双击这个html你就能看到精美的分析报告了 其中分析数据有三种函数可以用除了上面提到的analyze函数还有 compare 和 compare_intra 函数。
首先是analyze函数
analyze(source: Union[pd.DataFrame, Tuple[pd.DataFrame, str]],target_feat: str None,feat_cfg: FeatureConfig None,pairwise_analysis: str auto)可见其有以下4个参数可以配置
2.读入数据
代码如下示例
data pd.read_csv(https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv)
print(data.head())该处使用的url网络请求的数据。 compare()丨两个数据集比较
my_report sv.compare([my_dataframe, Training Data], [test_df, Test Data], Survived, feature_config)要比较两个数据集只需使用该 compare() 函数。它的参数与 analyze() 相同只是插入了第二个参数来覆盖比较数据帧。建议使用 [dataframe, “name”] 参数格式以更好地区分基础数据帧和比较数据帧。例如 [my_df, “Train”] 比 my_df 更好
compare_intra()丨数据集栏目比较
my_report sv.compare_intra(my_dataframe, my_dataframe[“Sex”] “male”, [“Male”, “Female”], feature_config)
想要对数据集中某个栏目下的参数进行分析就采用这个函数进行。 例如如果需要比较“性别”栏目下的“男性”和“女性”就可以采用这个函数。
3.调整报告布局
一旦你创建了你的报告对象只需将它传递给两个show函数中的一个
show_html():
show_html( filepathSWEETVIZ_REPORT.html,open_browserTrue,layoutwidescreen,scaleNone)show_html(…)将在当前文件路径中创建并保存 HTML 报告。有以下参数
layout (布局)无论是 widescreen’或 ‘vertical’。当鼠标移过每个功能时宽屏布局会在屏幕右侧显示详细信息。新的从 2.0 开始垂直布局在水平方向上更加紧凑并且可以在单击时扩展每个细节区域。
scale使用浮点数scale0.8或 None 来缩放整个报告。
open_browser启用 Web 浏览器的自动打开以显示报告。如果不需要可以在此处禁用它。
2.show_notebook():
show_notebook( wNone,hNone,scaleNone,layoutwidescreen,filepathNone)它将嵌入一个 IFRAME 元素在notebook中显示报告例如 Jupyter、Google Colab 等。
请注意由于Notebook通常是一个更受限制的环境因此使用自定义宽度/高度/比例值 (w , h , scale) 可能是个好主意。选项是
w宽度设置报告输出窗口的宽度。可以是百分比字符串 ( w“100%”) 或像素 (w900)。
h高度设置报告输出窗口的高度。可以是像素数 (h700) 或将窗口拉伸到与所有特征 ( h“full”)一样高。
scale与上面的 show_html 相同。
layout与上面的 show_html 相同。
scale与上面的 show_html 相同。
filepath可选的输出 HTML 报告。
总结
我们的文章到此就结束啦如果你喜欢今天的Python 实战教程请持续关注徐浪老师大讲堂