python 数据分析 -pandas 基础 3- 数据对齐
1. pandas 数据对齐
索引是 pandas 两个重要数据结构 Series 和 DataFrame 的重要组成部分,默认的索引是以 0 开始序列,也可以自定义数据。
因为有索引的存在,Series 和 DataFrame 在进行数据操作的时候,会自动进行数据对齐。
我们来看一个例子:
复制代码
从上面可知,s1 和 s2 具有不同的索引,s1 + s2
并不是 Series 中的数据按序相加,而是自动按照索引进行对齐,有时候我们可以利用这个特性进行数据处理,有时候需要注意这种特性会产生和预期不同的结果。
如果我们需要对 s1 和 s2 按序相加要怎么办? 这个时候需要对索引进行重置成默认序列索引,在进行相加。
复制代码
上面可知,通过reset_index
将索引重置到 0 到 3, 相加就是按序相加。
reset_index 默认会将索引作为新的一列增加到数据中, 如果你不需要索引可以指定drop=True
复制代码
希望对你有帮助。
版权声明: 本文为 InfoQ 作者【AIWeker】的原创文章。
原文链接:【http://xie.infoq.cn/article/59ddca3c3ad3c5c2969bf7527】。文章转载请联系作者。
评论