红酒网站建设方案,淮北论坛最新招聘,私自搭建vps犯法吗,WordPress文章角标今天给大家介绍一个十分好用的Python模块#xff0c;用来给数据集做一个初步的探索性数据分析(EDA)#xff0c;有着类似Tableau的可视化界面#xff0c;我们通过对于字段的拖拽就可以实现想要的可视化图表#xff0c;使用起来十分的简单且容易上手#xff0c;学习成本低用来给数据集做一个初步的探索性数据分析(EDA)有着类似Tableau的可视化界面我们通过对于字段的拖拽就可以实现想要的可视化图表使用起来十分的简单且容易上手学习成本低并且不需要我们写一大推冗长的代码。
PyGWalker
接下来就给大家来介绍一下这款名叫PyGWalker的Python模块在使用之前我们先通过pip命令来将其下载安装代码如下
pip install pygwalker
## 或者是
conda install pygwalker我们将其与pandas模块相结合毕竟我们这里还是需要它来读取CSV数据集的这是一份共享单车的用户使用数据代码如下
import pandas as pd
import pygwalker as pyg模块导入完成之后便是对数据集的读取了代码如下
df pd.read_csv(rbike_sharing_dc.csv, parse_dates[date])
df.head()output 接下去便是PyGWalker该登场的时候了代码如下
pyg.walk(df)output 我们随后变回看到如上图所示的界面是不是和Tableau的界面很像呢同样在左边的一栏中我们可以看到数据集中各个字段被分成了离散型变量(categorical data)和数值型变量(numeric data)
绘制可视化图表
接下来我们尝试来绘制可视化图表拖拽当中的字段放置到X轴或者Y轴当中就会有可视化图表显示出来 那么我们可以尝试绘制不同形态的图标例如我们想要绘制折线图例如我们在横轴放置的是“hour”这个离散型变量registered字段也就是注册量作为纵轴来查看不同时间段之下单车的使用量情况同时在“Color”这一栏中放置的是“season”变量代表的是不同的季节当中不同时间段的单车App的注册量情况 我们将图表的形态变成区域图 同时我们还可以来更改图表的大小操作起来也十分的方便
过滤数据
这里我们还可以来过滤数据主要是在filter这一栏来进行操作要是将离散型变量拖拽过去的话可以指定筛选的条件是哪些例如只查看“春天”和“夏天”这两者的数据然后图表依据筛选出来的条件来呈现最终的样子 那么要是将数值型变量拖拽过去的话会出来一个横向的数轴并且设定横轴的上下限那么最终的图表也会根据筛选出来的条件来呈现最终的样子
查看原始数据
最后要是我们想要查看原始数据PyGWalker模块也提供了非常方便的途径点击当中的“Data”选项