抖音做我女朋友好不好网站,北京网站建设企业,wordpress移动端插件menu,网页版梦幻西游能赚钱吗文章目录 #x1f3f3;️#x1f308; 1. 导入模块#x1f3f3;️#x1f308; 2. Pandas数据处理2.1 读取数据2.2 查看数据信息2.3 日期处理#xff0c;提取年份、月份2.4 经费处理2.5 天数处理 #x1f3f3;️#x1f308; 3. Pyecharts数据可视化3.1 出发日期_… 文章目录 ️ 1. 导入模块️ 2. Pandas数据处理2.1 读取数据2.2 查看数据信息2.3 日期处理提取年份、月份2.4 经费处理2.5 天数处理 ️ 3. Pyecharts数据可视化3.1 出发日期_年份分布3.2 出发日期_月份分布3.3 出行天数分布3.4 旅游途经点分布3.5 出行团体占比3.6 人均消费区间占比3.7 出行类型标签统计3.8 旅游行程景点词云 ️ 4. 可视化项目源码数据 大家好我是 【Python当打之年(点击跳转)】
本期利用 python 分析一下「去哪网海南旅游攻略数据」 看看海南哪些旅游景点最受大家喜爱哪个时间段旅游的朋友比较多最受大家欢迎的旅行方式有哪些以及旅行目的 等希望对大家有所帮助如有疑问或者需要改进的地方可以联系小编。
涉及到的库
Pandas — 数据处理Pyecharts — 数据可视化
️ 1. 导入模块
import pandas as pd
from pyecharts.charts import Line
from pyecharts.charts import Bar
from pyecharts.charts import Pie
from pyecharts.charts import Scatter
from pyecharts.charts import WordCloud
from pyecharts import options as opts
import warnings
warnings.filterwarnings(ignore)️ 2. Pandas数据处理
2.1 读取数据
df pd.read_excel(./去哪网海南攻略数据.xlsx)2.2 查看数据信息
df.info()2.3 日期处理提取年份、月份
df[出发日期_年] [int(i.split(-)[0]) for i in df[出发日期].tolist()]
df[出发日期_月] [int(i.split(-)[1]) for i in df[出发日期].tolist()]2.4 经费处理
fee [int(i.replace(人均,).replace(元,)) for i in df_fee[人均消费].tolist()]
df_fee[人均消费] fee2.5 天数处理
df[天数] df[天数].str[1:-1]
df[天数] df[天数].astype(int)️ 3. Pyecharts数据可视化
3.1 出发日期_年份分布
def get_chart1():chart (Bar().add_xaxis(x_data).add_yaxis(, y_data).set_global_opts(title_optsopts.TitleOpts(title1-出发日期_年,pos_top2%,pos_leftcenter,),legend_optsopts.LegendOpts(is_showFalse),xaxis_optsopts.AxisOpts(splitline_optsopts.SplitLineOpts(is_showFalse)),yaxis_optsopts.AxisOpts(splitline_optsopts.SplitLineOpts(is_showFalse)),visualmap_optsopts.VisualMapOpts(is_showFalse,),))return chart2014、2015、2016年的攻略数量相较于其他年份明显较多、2017-2021年趋于平稳。 近三年时间大概由于时间比较近加之疫情原因所以攻略数量较少。
3.2 出发日期_月份分布
def get_chart2():chart (Line().add_xaxis(x_data).add_yaxis(, y_data).set_global_opts(title_optsopts.TitleOpts(title2-每月攻略数量,pos_top2%,pos_leftcenter,),visualmap_optsopts.VisualMapOpts(is_showFalse),legend_optsopts.LegendOpts(is_showFalse),))return chart1月、12月的攻略数比较高大概占到了总数量的20%反而6月、7月、8月的数量相对低一些。
3.3 出行天数分布 从出行天数上来看大多集中在一周5天左右也有少量半个月、一个月的旅游时间。
3.4 旅游途经点分布 首当其冲当然是三亚1853啦远超排在第二的海口182基本是10倍之多紧随其后的是陵水108、万宁60、文昌46等地。
3.5 出行团体占比
def get_chart3():chart (Pie().add(, [list(z) for z in zip(x_data, y_data)]).set_global_opts(title_optsopts.TitleOpts(title5-出行团体占比,pos_top2%,pos_leftcenter),legend_optsopts.LegendOpts(is_showFalse),visualmap_optsopts.VisualMapOpts(is_showFalse,),).set_series_opts(label_optsopts.LabelOpts(formatter{b}: {d}%)))return chart出行团体方面大多以好友22%、情侣21%和家庭20%团体居多。
3.6 人均消费区间占比 人均消费3000-5000元居多占比46%1000-3000元占比28%。
3.7 出行类型标签统计 3.8 旅游行程景点词云
def get_chart4():chart (WordCloud().add(,words,word_size_range[10,50]).set_global_opts(title_optsopts.TitleOpts(title8-旅游行程景点词云,pos_top2%,pos_leftcenter,),legend_optsopts.LegendOpts(is_showFalse),visualmap_optsopts.VisualMapOpts(is_showFalse),))return chart亚龙湾、三亚湾、蜈支洲岛、大东海、天涯海角、海棠湾等景点更受驴友的喜爱。
️ 4. 可视化项目源码数据 点击跳转【全部可视化项目源码数据】 以上就是本期为大家整理的全部内容了赶快练习起来吧原创不易喜欢的朋友可以点赞、收藏也可以分享注明出处让更多人知道。