网站系统升级维护需要多长时间,网站建设哪里好 厦门,企业只有建立了自己的网站,网站排名提高panads简介
pandas是基于Numpy创建的Python包#xff0c;内置了大量标准函数#xff0c;能够高效地解决数据分析数据处理和分析任务#xff0c;pandas支持多种文件的操作#xff0c;比如Excel#xff0c;csv#xff0c;json#xff0c;txt 文件等#xff0c;读取文件之…panads简介
pandas是基于Numpy创建的Python包内置了大量标准函数能够高效地解决数据分析数据处理和分析任务pandas支持多种文件的操作比如Excelcsvjsontxt 文件等读取文件之后就可以对数据进行各种清洗、分析操作了。
padas和excel中数据结构的对应关系
pandasexcelDataFrame工作表WorksheetSeries列Columnindex行号row indexRow行RowNaN空单元格empty cell
DataFrame
Pandas 中的 DataFrame 类似于 Excel 工作表虽然 Excel 工作簿可以包含多个工作表但 Pandas DataFrame 独立存在的。
Series
序列是表示 DataFrame 的一列的数据结构,类似于引用电子表格的列。
Index
每个 DataFrame 和 Series 都有一个索引它们是数据行上的标签。在 Pandas 中如果未指定索引则默认使用 RangeIndex第一行 0第二行 1依此类推类似于电子表格中的每行开始的数字。 在 Pandas 中索引可以设置为一个或多个唯一值这就像在工作表中有一列用作行标识符一样这些索引值可用于引用行。索引值是持久的所以对 DataFrame 中的行重新排序特定行的标签不会改变。
pandas读取excel
pandas读取文件之后将内容存储为DataFrame然后就可以调用内置的各种函数进行分析处理。
pandas对xlrd等模块进行了封装可以很方便的处理excel文件支持xls和xlsx等格式需要提前安装模块pip install openpyxl
read_excel
pandas.read_excel(filename, sep, header,encoding)参数解释
**filename**文件路径可以设置为绝对路径或相对路径**sep**分隔符常用的有逗号 , 分隔、\t 分隔默认逗号分隔read_table默认是’\t’(也就是tab)切割数据集的**header**指定表头即列名默认第一行header None, 没有表头全部为数据内容**encoding**文件编码方式不设置此选项 Pandas 默认使用 UTF-8 来解码。index_col 指定索引对应的列为数据框的行标签默认 Pandas 会从 0、1、2、3 做自然排序分配给各条记录。通过names[‘a’,‘b’,‘c’]可以自己设置列标题
read_table()
可以读取Excel中的数据表并指定分隔符如制表符或逗号。
pd.read_table(data.xlsx, sheet_nameSheet1, delimiter\t, header0)data.xlsx’是Excel文件的路径。sheet_nameSheet1’表示要读取的工作表名为’Sheet1’。delimiter’\t’指定数据表中的分隔符为制表符‘\t’。header0表示将文件中的第0行作为列名。
例子 import pandas as pd
result pd.read_excel(rE:\2021竞赛题目列表本科.xlsx)
print(result)创建Excel
import pandas as pd# 创建数据框
data {Name: [Tom, Jerry, Mickey, Donald],Age: [20, 25, 22, 28],Gender: [M, M, M, M]}
df pd.DataFrame(data)# 保存数据框到 Excel 文件
df.to_excel(example.xlsx, indexFalse)效果
常用操作合集