Python 教程之数据分析(4)—— 使用 Python 进行数据分析和可视化 | 第 1 套
Python 是一种用于进行数据分析的出色语言,主要是因为以数据为中心的 Python 包的奇妙生态系统。Pandas 就是其中之一,它使导入和分析数据变得更加容易。在本文中,我使用 Pandas 分析了来自流行的“statweb.stanford.edu”网站的联合国公共数据集的 Country Data.csv 文件中的数据。在分析印度国家数据时,我介绍了 Pandas 的关键概念如下。在阅读本文之前,请大致了解 matplotlib 和 csv 的基础知识。
安装 pandas 最简单的方法是使用 pip:
或者,从这里下载
在 Pandas 中创建数据框
数据框的创建是通过使用 pd.Series 方法将多个系列传递给 DataFrame 类来完成的。在这里,它传入两个 Series 对象,s1 作为第一行,s2 作为第二行。例子:
输出:
![](https://static001.geekbang.org/infoq/df/dfef960b08d72f9b04d3510a5ba4a26e.png)
![](https://static001.geekbang.org/infoq/39/3931150ee05170d602327bd383b2dc47.png)
![](https://static001.geekbang.org/infoq/39/3986f840f52630a413535910fe9ada67.png)
使用 Pandas 导入数据
第一步是读取数据。数据存储为逗号分隔值或 csv 文件,其中每一行由新行分隔,每一列由逗号 (,) 分隔。为了能够在 Python 中处理数据,需要将 csv 文件读入 Pandas DataFrame。DataFrame 是一种表示和处理表格数据的方法。表格数据有行和列,就像这个csv 文件一样(点击下载)。例子:
输出:
![](https://static001.geekbang.org/infoq/93/930ab32cfcce8a9e176970a8a61ed669.png)
使用 Pandas 索引 DataFrame
可以使用 pandas.DataFrame.iloc 方法进行索引。iloc 方法允许按位置检索尽可能多的行和列。例子:
在 Pandas 中使用标签进行索引
可以使用 pandas.DataFrame.loc 方法对标签进行索引,该方法允许使用标签而不是位置进行索引。例子:
上面的内容实际上看起来与 df.iloc[0:5,:] 没有太大区别。这是因为虽然行标签可以采用任何值,但我们的行标签与位置完全匹配。但是在处理数据时,列标签可以让事情变得更容易。例子:
![](https://static001.geekbang.org/infoq/fd/fd6bc3919513059f4d781e8b8c6db0d9.png)
使用 Pandas 进行 DataFrame 数学运算
数据帧的计算可以使用 pandas 工具的统计函数来完成。例子:
![](https://static001.geekbang.org/infoq/0a/0a3a3e0a87cf90677ee9077a95795f48.png)
![](https://static001.geekbang.org/infoq/43/4321d420907fd974bae9a5cdac428872.png)
![](https://static001.geekbang.org/infoq/17/17ae1f6143f8c097c2f9339285d95a89.png)
熊猫绘图
这些示例中的绘图是使用引用 matplotlib API 的标准约定制作的,该 API 提供了 pandas 的基础知识,可以轻松创建美观的绘图。例子:
![](https://static001.geekbang.org/infoq/43/439ecaa5b996bba1f63bbf7f68854c01.png)
![](https://static001.geekbang.org/infoq/d4/d42965f34606b7f3aa600392c398ab6c.png)
![](https://static001.geekbang.org/infoq/3c/3c890381e64e8d6eae0a16fc6548c626.png)
本篇文章到此就结束了,相关文章:
感谢大家的阅读,有什么问题的话可以在评论中告诉我。希望大家能够给我来个点赞+收藏+评论 ,你的支持是海海更新的动力!后面我会持续分享前端 & 后端相关的专业知识。
版权声明: 本文为 InfoQ 作者【海拥(haiyong.site)】的原创文章。
原文链接:【http://xie.infoq.cn/article/93f7d72ae46f3649473cc4ffb】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论 (1 条评论)