精选 22 个 pandas 实用函数
公众号:尤而小屋
作者:Peter
编辑:Peter
大家好,我是 Peter~
今天小编又从 26 个字母中精选出 22 个 Pandas 常用的函数,将它们的使用方法简单介绍给大家,详细内容可以查看官网学习。
其中 o、y、z 没有相应的函数。之前写过一篇文章,可以参考学习:
apply 函数
Pandas 中一个很实用的函数,下面模拟了一份数据:
我们分别将 python 的内置函数、自定义函数、匿名函数传给 apply 函数:
使用 Python 的匿名函数来进行传递:
between_time
来自官网的案例:
如果在参数中,开始时间大于结束时间,则会呈现不同的结果:
contains 函数
针对 Series 中的包含字符信息:
drop_duplicates 函数
删除数据中的重复值;可以选择根据某个或者多个字段来删除。
在删除数据的时候,默认保留的是第一条重复的数据,我们可以通过参数 keep 来指定保留最后一条
expanding 函数
这是一个窗口函数,实现的是一种类似累计求和的功能
min_periods:每个窗口最少包含的观测值数量,小于该数量的窗口结果为 NA。值可以是 int,默认 None。offset 情况下,默认为 1
center:把窗口的标签设置为居中,布尔型,默认 False,居右
axis:默认为 0,对列进行计算
method:single 或者 table
模拟了一份数据:
分别指定 1-2-3 不同的窗口数:
我们发现:当窗口数大于前面的记录数,则累计和用 NaN 表示
filter 函数
用来进行数据的过滤操作
items:表示包含的字段
regex:表示使用正则
ge 函数
进行比较的一个函数:ge 表示 greater equal
hist 函数
pandas 内置的绘制直方图的函数
iterrows 函数
iterrows 函数用于对 DataFrame 进行迭代循环
join 函数
join 函数用于合并不同的 DataFrame
kurtosis 函数
用于查找一组数据中的峰度值
axis:要应用的函数的轴。
skipna:计算结果时排除 NA /null 值。
level:如果轴是 MultiIndex(分层),则沿特定级别计数,并折叠成标量。
numeric_only:仅包括 float,int,boolean 列。
**kwargs:要传递给函数的其他关键字参数
如果给定的数据中存在缺失值,可以使用参数 skipna 直接跳过:
last 函数
这是一个用在基于时间数据选择上的函数
注意:在这里返回的日历中 3 个日的数据,而不是数据中的 3 行记录。13-14-15 刚好是 3 天
max/min/mean/median
4 个基于统计概念的函数:最大值、最小值、均值、中位数
nlargest 函数
选择前 n 个的数据,其语法如下:
n:整数
columns:根据一个或者多个字段筛选
keep:选择 first、last、all;默认是 first
下面的例子来自官网:
keep 参数在不同取值下的结果:
pop 函数
表示删除某个属性或者字段信息
quantile 函数
quantile 就是分位数的意思,函数具体的语法规则为:
q : 数字或者是类列表,范围只能在 0-1 之间,默认是 0.5,即中位数-第 2 四分位数
axis :计算方向,0-index, 1-columns,默认为 0
numeric_only:只允许是数值型数据
interpolation(插值方法):可以是 {‘linear’, ‘lower’, ‘higher’, ‘midpoint’, ‘nearest’}之一,默认是 linear。
reset_index 函数
reset 就是重置的含义,index 就是行索引;连起来就是重置行索引
当我们统计每种水果的总销售额,是否使用 reset_index 函数的不同效果:
select_dtypes 函数
根据字段类型来筛选数据,可以包含或者排除一个或者多个字段类型的数据。
下面是官网的案例,稍作修改:生成了 3 个不同数据类型的字段
1、包含字段类型
2、排除字段类型
take 函数
也是选择数据的一个函数,具体语法为:
indices:选择位置:数组或者切片
axis:选择的轴,0-index,1-column,默认是 0
is_copy:是否返回副本;从 Pandas1.0 开始
下面是多个例子:
以第一个例子来解释,指定数据的记录为 0 和 4。表示取出 df10 中的第 1 条和第 5 条数据(索引从 0 开始),而不是看我们自定义的索引号。
update 函数
更新某个 DataFrame 数据框;模拟两个数据:
第一次更新的结果:
如果用于更新的数据中存在空值,则保持原来的数据不变
var 函数
用于求一组数据的方差
where 函数
用于查找满足条件的数据
版权声明: 本文为 InfoQ 作者【Peter】的原创文章。
原文链接:【http://xie.infoq.cn/article/b685b3ecf963a833b35ccda51】。文章转载请联系作者。
评论