当前位置: 首页 > news >正文

旅游网站开发选题背景如何查看一个网站用什么程序做的

旅游网站开发选题背景,如何查看一个网站用什么程序做的,网站开发不满意,中国电信软件开发工程师待遇pandas#xff1a;完整的初学者指南 一、说明 在你的Python开发人员或数据科学之旅中#xff0c;你可能已经多次遇到“熊猫”这个词#xff0c;但仍然需要弄清楚它的作用。以及数据和熊猫之间的关系。所以让我向你解释一下。 根据最新估计#xff0c;每天创建 328.77 亿 TB… pandas完整的初学者指南 一、说明 在你的Python开发人员或数据科学之旅中你可能已经多次遇到“熊猫”这个词但仍然需要弄清楚它的作用。以及数据和熊猫之间的关系。所以让我向你解释一下。 根据最新估计每天创建 328.77 亿 TB 的数据。 现在是我们利用如此大量的数据来产生见解并预测当前和未来结果的时候了因此pandas不能不修。 Pandas是一个基于NumPy和Matplotlib构建的Python库主要用于处理DATA。它用于分析清理探索和操作数据。 它由Wes McKinney于2008年开发用于数据分析目的。 摄影Justin Morgan on Unsplash 二、为什么我们需要pandas 一般来说我们通过智能手机、物联网设备、调查和其他各种来源接收的数据充满了相关和不相关的信息其中包含重复、缺失和无法操作的值因此完全难以得出结论。因此熊猫使我们能够从数据中产生有意义和有价值的见解。 从以表格格式排列数据执行统计分析到生成图表熊猫一切皆有可能使数据分析师和科学家可以轻松地在一个库下执行所有任务。 简单来说熊猫就像一个过滤器我们可以用来净化我们的原始数据以产生有价值的见解。 三、如何使用熊猫 在窥视熊猫的工具之前我们必须了解数据在熊猫中是如何存储和排列的。熊猫包含两种类型的数据结构 系列 series数据帧 dataframe 系列它是一个一维数组能够保存任何数据类型的数据。 names [Alex, Bob, John] df pd.Series(names, index[1, 2, 3]) print(df) 数据帧 数据帧是由行和列如表组成的二维数据结构。它是熊猫中最受欢迎的数据结构。 df pd.read_csv(E:\emp_report.csv) print(df) 我导入了一个CSV逗号分隔值一个使用逗号分隔值的分隔文本文件。在 pandas 中我们可以使用 read_csv 命令导入 CSV 文件然后传递文件位置。 head 默认情况下head 方法返回数据框的前五行。 print(df.head()) 我们可以看到主数据框中有六行但使用 head 命令它打印了数据框的前五行。 甚至可以使用 headn 指定所需的行数;如果我们传递 head12它将打印数据框的前 12 行。 2. tail tail 方法类似于 head但默认情况下它不是打印顶部行而是返回数据框的最后五行。 print(df.tail()) 我们甚至可以使用 tailn 指定我们想要的底部行数;如果我们传递 tail10它将打印数据框的最后十行。 3.info info 方法给出了数据框的完整描述例如列数、每列的数据类型、数据框的内存使用情况等。 print(df.info()) 4. describe describe 方法给出了数据帧的完整统计分析例如每列的最大值、最小值、百分位数、总非空值和标准偏差。 print(df.describe()) 5. shape Pandas 中的 shape 属性为我们提供了有关数据框形状的信息即数据框中的行数和列数。 print(df.shape) 这里的六是指行数五是指列数。 6. valuse 返回二维数组中数据框的所有值。 print(df.values) 7. column 列属性返回数据框中每列的标注或名称。 print(df.columns) 8. index index 属性返回数据框的索引信息。 print(df.index) 9. count count 方法返回每行或每列的非空值或非 NA 的总数。 print(df.count()) 10. value_counts value_counts 方法返回唯一值的计数。 print(df.value_counts(positions)) 11. sort_values 排序是指按升序或降序排列数据。在 Pandas 中我们可以使用 sort_values 方法对列进行排序方法是传递列名然后将升序参数设置为 True 或 False。 print(df.sort_values(salary, ascendingTrue)) 在这里我传递了工资列并将升序参数设置为 True 作为升序;设置为 False 的升序参数将按降序排列工资列。 print(df.sort_values(salary, ascendingFalse)) 还有一些参数例如na_position和就地。na_position允许我们通过传递“第一个”或“最后一个”来选择如何排列 NaN。而当就地设置为 True 时请就地执行操作。 12. group 分组允许我们根据类别对数据进行分组然后对这些类别执行函数。 print(df.groupby(sex)[salary].sum()) 在这里我们根据性别一栏将所有员工分为两类“M”代表男性“F”代表女性然后根据性别计算总工资。 13. isna 使用 isna 方法我们可以检查数据框中的缺失值或 NaNnot-a-number为 NaN 值返回 True否则返回 False。 print(df.isna()) 14. fillna fillna 方法将数据框中的缺失值或 NaN非数字替换为指定值。 print(df.fillna({sex:F, positions: Developer, salary: 90000})) 15. dropna 我们甚至可以使用 dropna 方法删除数据框中缺少值或 NaN非数字的行。 print(df.dropna()) 16. 重复 duplicated 方法允许我们检查数据框中的重复值。对于重复值返回 True;否则是假的。 print(df.duplicated(subsetemp_names)) 17. drop_duplicates drop_duplicates 方法允许我们删除具有重复值的行。 print(df.drop_duplicates(subsetemp_names)) 18.plot 我们可以使用 Pandas 库和 matplotlib 库的绘图方法绘制图形。下面是绘制简单条形图的示例。 import matplotlib.pyplot as plt g df.groupby(sex)[salary].sum() g.plot.bar(g) plt.show() 四、结论 上面的例子表明Pandas 命令快速而灵活允许我们分析数据、处理缺失的数据甚至帮助我们删除重复值和可视化数据。
http://www.dnsts.com.cn/news/207133.html

相关文章:

  • 哪家房屋设计公司网站wordpress仿京东
  • 五网合一网站建设丹徒网站建设报价
  • 图片模板 网站源码室内设计学校大专
  • 个体工商户做网站能加地名吗如何查看网站建站程序
  • 做30个精品网站深圳网站制作收费
  • 可以做手机网页的网站做网站的行业平台
  • 网站开发企业部门京东联盟怎么做CMS网站
  • 网站规划和布局浙江建设职业技术学院
  • 建一个网站需要多少费用网架公司安全员需要什么证书
  • 云南网站开发费用Wordpress 图片 不显示
  • 做网站的关键词在线室内设计
  • 校园网站建设方案策划书口碑好个人品牌营销公司
  • 网站在百度上搜不到常平网站
  • 西安网站seo工作室北京规划建设 杂志 官方网站
  • 怎么把网站关掉太月星网站建设程序开发
  • 网站建设hyioi网站取消备案
  • 电商网站建设标准wordpress文章怎么生成海报
  • 怎样做展示型网站wordpress大主题公园
  • 网站流量增长小企业网站建设厂家有哪些
  • 做系统的图标下载网站郑州 互联网 公司网站
  • 谷歌网站提交梦创义网站建设公司
  • 福田做网站优化乐云seo宁波谷歌推广
  • 做网站编辑大专可以吗网站404页面的作用
  • 做创意美食的视频网站有哪些有哪些做兼职的设计网站有哪些工作内容
  • 淘宝客优惠券网站建设教程北京建设网站的公司兴田德润简介
  • 河北常见网站建设价格网站建设毕业设计开题报告
  • 做条形图的网站除了seo还可以做哪些推广呢
  • 企业网站推广的名词解释上海网站建设过程
  • 公司网站广州市建设信息网
  • 重庆网站建设百度推广ps软件下载手机版免费