有没有做网页的网站,怎么选择网站建设,韩国今天新闻,开发公司与物业公司移交消防协议【Pandas驯化-03】Pandas中常用统计函数mean、count、std、info使用 本次修炼方法请往下查看 #x1f308; 欢迎莅临我的个人主页 #x1f448;这里是我工作、学习、实践 IT领域、真诚分享 踩坑集合#xff0c;智慧小天地#xff01; #x1f387; 相关内容文档获取 微…【Pandas驯化-03】Pandas中常用统计函数mean、count、std、info使用 本次修炼方法请往下查看 欢迎莅临我的个人主页 这里是我工作、学习、实践 IT领域、真诚分享 踩坑集合智慧小天地 相关内容文档获取 微信公众号 相关内容视频讲解 B站 博主简介AI算法驯化师混迹多个大厂搜索、推荐、广告、数据分析、数据挖掘岗位 个人申请专利40熟练掌握机器、深度学习等各类应用算法原理和项目实战经验。 技术专长 在机器学习、搜索、广告、推荐、CV、NLP、多模态、数据分析等算法相关领域有丰富的项目实战经验。已累计为求职、科研、学习等需求提供近千次有偿|无偿定制化服务助力多位小伙伴在学习、求职、工作上少走弯路、提高效率近一年好评率100% 。 博客风采 积极分享关于机器学习、深度学习、数据分析、NLP、PyTorch、Python、Linux、工作、项目总结相关的实用内容。 文章目录 一、基本介绍 二、使用方法常用函数创建DataFrame 三、进阶用法 四、注意事项 五、总结 下滑查看解决方法 一、基本介绍 Pandas中的统计函数是数据分析中不可或缺的工具它们可以帮助我们快速计算数据集中的描述性统计数据如均值、中位数、标准差等可以快速的对数据进行分布分析、异常值分析、数据类型等基本数据统计分析。 二、使用方法
常用函数 Pandas 提供了很多统计函数以下是一些常用的
mean(): 计算均值median(): 计算中位数std(): 计算标准差var(): 计算方差sum(): 计算总和min(): 找到最小值max(): 找到最大值count(): 数值的个数info(): 总体数据分布
创建DataFrame
import pandas as pd
data {Name: [Alice, Bob, Charlie, David, Eva],Age: [24, 27, 22, 32, 29],Income: [50000, 54000, 35000, 62000, 58000]
}
df pd.DataFrame(data)
# 计算年龄的均值
mean_age df[Age].mean()
print(Mean Age:, mean_age)# 计算收入的中位数
median_income df[Income].median()
print(Median Income:, median_income)# 计算年龄的标准差
std_age df[Age].std()
print(Standard Deviation of Age:, std_age)# 计算年龄的方差
var_age df[Age].var()
print(Variance of Age:, var_age)# 计算所有人的总收入
total_income df[Income].sum()
print(Total Income:, total_income)# 找到年龄的最大值和最小值
max_age df[Age].max()
min_age df[Age].min()
print(Max Age:, max_age, Min Age:, min_age) 三、进阶用法 当我们想要对整体的数据进行分布的查看时需要查看各个列是否有缺失值以及每个列的数据格式是什么样子时这个时候需要可以通过info函数来获取相关的结果具体的代码如下所示 print(df.info())class pandas.core.frame.DataFrameRangeIndex: 5 entries, 0 to 4Data columns (total 3 columns):# Column Non-Null Count Dtype --- ------ -------------- ----- 0 Name 5 non-null object1 Age 5 non-null int64 2 Income 5 non-null int64 dtypes: int64(2), object(1)memory usage: 248.0 bytesNone 从上面的输出结果可以看出来每个列是否有缺失值以及每个列中的数据格式是什么样子的。 四、注意事项 对上述的各个统计函数在使用的过程中需要注意的一些事项不然可能会出现error具体主要为
确保在使用统计函数之前数据是干净且适合进行统计分析的。某些统计函数如 mean() 和 median()可能会受到异常值的影响。在这种情况下可能需要先进行数据清洗或转换。当使用 std() 和 var() 时要注意它们计算的是样本标准差和方差还是总体标准差和方差。默认情况下Pandas 计算的是总体标准差和方差不使用 Bessel’s correction。 五、总结 Pandas 的统计函数是数据分析中的强大工具它们可以帮助我们快速获取数据的关键信息。通过上述示例我们可以看到如何使用这些函数来分析数据集。然而为了得到准确的分析结果我们需要确保数据的质量并注意函数的使用条件。希望这篇博客能帮助你更好地利用 Pandas 进行数据分析。