当前位置: 首页 > news >正文

网站建设费用上海artdialog wordpress主题

网站建设费用上海,artdialog wordpress主题,南京建设企业网站的公司,济南网站关键词优化公司Pandas——groupby操作 文章目录Pandas——groupby操作一、实验目的二、实验原理三、实验环境四、实验内容五、实验步骤一、实验目的 熟练掌握pandas中的groupby操作 二、实验原理 groupby(byNone, axis0, levelNone, as_indexTrue, sortTrue, group_keysTrue, squeezeFalseNone, axis0, levelNone, as_indexTrue, sortTrue, group_keysTrue, squeezeFalse 参数说明 by是指分组依据列表、字典、函数元组Series axis是作用维度0为行1为列 level根据索引级别分组 sort对groupby分组后新的dataframe中索引进行排序sortTrue为升序 as_index在groupby中使用的键是否成为新的dataframe中的索引默认as_indexTrue group_keys在调用apply时将group键添加到索引中以识别片段 squeeze 如果可能的话减少返回类型的维数否则返回一个一致的类型 grouping操作split-apply-combine 数据的分组聚合 – 什么是groupby 技术? 在数据分析中我们往往需要在将数据拆分在每一个特定的组里进行运算。比如根据教育水平和年龄段计算某个城市的工作人口的平均收入。 pandas中的groupby提供了一个高效的数据的分组运算。 我们通过一个或者多个分类变量将数据拆分然后分别在拆分以后的数据上进行需要的计算 我们可以把上述过程理解为三部 1.拆分数据split 2.应用某个函数apply 3.汇总计算结果aggregate 下面这个演示图展示了“分拆-应用-汇总”的groupby思想 上图所示分解步骤 Step1 数据分组—— groupby 方法 Step2 数据聚合 使用内置函数——sum / mean / max / min / count等 使用自定义函数—— agg ( aggregate ) 方法 自定义更丰富的分组运算—— apply 方法 三、实验环境 Python 3.6.1 Jupyter 四、实验内容 练习pandas中的groupby的操作案例 五、实验步骤 1.创建一个数据帧df。 import numpy as np import pandas as pd df pd.DataFrame({A : [foo, bar, foo, bar, foo, bar, foo, foo],B : [one, one, two, three, two, two, one, three],C : np.random.randn(8),D : np.random.randn(8)}) print(df) 2.通过A列对df进行分布操作。 df.groupby(A) 3.通过A、B列对df进行分组操作。 df.groupby([A,B]) 4…使用自定义函数进行分组操作自定义一个函数使用groupby方法并使用自定义函数给定的条件按列对df进行分组。 def get_letter_type(letter): if letter.lower() in aeiou: return vowel else: return consonant grouped df.groupby(get_letter_type, axis1) for group in grouped: print(group) 5.创建一个Series名为s使用groupby根据s的索引对s进行分组返回分组后的新Series对新Series进行first、last、sum操作。 lst [1, 2, 3, 1, 2, 3] s pd.Series([1, 2, 3, 10, 20, 30], lst) grouped s.groupby(level0) #查看分组后的第一行数据 grouped.first() #查看分组后的最后一行数据 grouped.last() #对分组的各组进行求和 grouped.sum() 6.分组排序使用groupby进行分组时默认是按分组后索引进行升序排列在groupby方法中加入sortFalse参数可以进行降序排列。 df2pd.DataFrame({X:[B,B,A,A],Y:[1,2,3,4]}) #按X列对df2进行分组并求每组的和 df2.groupby([X]).sum() #按X列对df2进行分组分组时不对键进行排序并求每组的和 df2.groupby([X],sortFalse).sum() 7.使用get_group方法得到分组后某组的值。 df3 pd.DataFrame({X : [A, B, A, B], Y : [1, 4, 3, 2]}) #按X列df3进行分组并得到A组的df3值 df3.groupby([X]).get_group(A) #按X列df3进行分组并得到B组的df3值 df3.groupby([X]).get_group(B) 8.使用groups方法得到分组后所有组的值。 df.groupby(A).groups df.groupby([A,B]).groups 9.多级索引分组创建一个有两级索引的Series并使用两个方法对Series进行分组并求和。 arrays [[bar, bar, baz, baz, foo, foo, qux, qux],[one, two, one, two, one, two, one, two]] indexpd.MultiIndex.from_arrays(arrays,names[first,second]) spd.Series(np.random.randn(8),indexindex) s.groupby(level0).sum() s.groupby(levelsecond).sum() 10.复合分组对s按first、second进行分组并求和。 s.groupby(level[first, second]).sum() 11.复合分组按索引和列创建数据帧df使用索引级别和列对df进行分组。 arrays [[bar, bar, baz, baz, foo, foo, qux, qux],[one, two, one, two, one, two, one, two]] index pd.MultiIndex.from_arrays(arrays, names[first, second]) df pd.DataFrame({A: [1, 1, 1, 1, 2, 2, 3, 3], B: np.arange(8)},indexindex) print(df) df.groupby([pd.Grouper(level1),A]).sum() 12.对df进行分组将分组后C列的值赋值给grouped统计grouped中每类的个数。 df pd.DataFrame({A : [foo, bar, foo, bar, foo, bar, foo, foo],B : [one, one, two, three, two, two, one, three],C : np.random.randn(8),D : np.random.randn(8)}) groupeddf.groupby([A]) grouped_Cgrouped[C] print(grouped_C.count()) 13.对上面创建的df的C列按A列值进行分组并求和。 df[C].groupby(df[A]).sum() 14.遍历分组结果通过AB两列对df进行分组分组结果的组名为元组。 for name, group in df.groupby([A, B]): print(name) print(group) 15.通过A列对df进行分组并查看分组对象的bar列。 df.groupby([A]).get_group((bar)) 16.按A,B两列对df进行分组并查看分组对象中bar、one都存在的部分。 df.groupby([A,B]).get_group((bar,one)) 注意:当分组按两列来分时查看分组对象也应该包含每列的一部分。 17.聚合操作按A列对df进行分组使用聚合函数aggregate求每组的和。 groupeddf.groupby([A]) grouped.aggregate(np.sum) 按A、B两列对df进行分组并使用聚合函数aggregate对每组求和。 groupeddf.groupby([A,B]) grouped.aggregate(np.sum) 注意通过上面的结果可以看到。聚合完成后每组都有一个组名作为新的索引使用as_indexFalse可以忽略组名。 18.当as_indexTrue时在groupby中使用的键将成为新的dataframe中的索引。按A、B两列对df进行分组这是使参数as_indexFalse再使用聚合函数aggregate求每组的和. groupeddf.groupby([A,B],as_indexFalse) grouped.aggregate(np.sum) 19.聚合操作按A、B列对df进行分组使用size方法求每组的大小。返回一个Series索引是组名值是每组的大小。 groupeddf.groupby([A,B]) grouped.size() 20.聚合操作对分组grouped进行统计描述。 grouped.describe() 注意聚合函数可以减少数据帧的维度常用的聚合函数有mean、sum、size、count、std、var、sem 、describe、first、last、nth、min、max。 执行多个函数在一个分组结果上在分组返回的Series中我们可以通过一个聚合函数的列表或一个字典去操作series返回一个DataFrame。
http://www.dnsts.com.cn/news/140502.html

相关文章:

  • 网站界面风格iis做网站上传速度慢
  • ie打不开建设企业网站哈市最新公告
  • 网站建设收费标准行情广州知名网站排名优化
  • 中国建设协会官网西安网站自然排名优化
  • 北京it培训机构哪家好领硕网站seo优化
  • 创新的宁波网站建设网站标题有图片要怎么做
  • 哈尔滨网站建设 熊掌号做网站是哪个专业
  • 折扣网站怎么做网站建设与管理课程项目
  • vi设计欣赏网站电子商务网站建设基础步骤
  • 凡科删除建设的网站个人简历表格可填写
  • 霸州建设局网站建设工程施工合同司法解释2022
  • 功能网站网站运行与维护
  • 搭建网站要不要给域名对方17网站一起做网店普
  • 网站建设如何设置登录页面公司名称吉凶查询大吉
  • 郑州网站建设正云南沙网站制作
  • 陕西省建设招投标网站做视频素材网站
  • 网站的首页需要什么内容泽成seo网站排名
  • 天津建设培训中心网站广州网站建设哪里买
  • 手机自建网站平台深圳专业英文网站建设
  • 好的网站制作网站广州灰色优化网络公司
  • 网站建设及管理基本要求临沂河东网站建设
  • 运营网站是多少企业网站建设方案 功能规划
  • 哪个做网站好游戏app定制开发
  • 做企业的网站都要准备什么手续央企网站群建设中标公告
  • 描述建设一个网站的具体步骤WordPress幻灯片首页
  • 微信分享网站短链接怎么做xampp wordpress 建站
  • 济南网站建设富库网络个人不动产登记网上查询
  • 外贸soho通过网站开发客户wordpress 餐饮 主题
  • 手机网站插件代码网站口碑营销
  • 网站设计评价如何新建网站