Python 中怎样合并数据
1. 问题
数据连接是数据处理中经常需要用到的操作。Python 常见的数据类型,都应该怎样进行连接呢?
2. 分析
2.1. list
list 的连接是最容易的,直接用 Python 语法即可。
输出结果
2.2. dict
dict 不支持 +
。想要合并两个dict,需要用到**
操作符。
输出结果
如果b里面有a的键值,后面的值会覆盖掉前面的值。
输出结果
2.3. set
set 不可 hashable,而且不支持+
,所以需要另想办法。
比如用它的union
方法,或者用iterate
特性,都可以得出相同的结果
2.4. ndarray
ndarray 合并的时候,需要注意坐标轴方向和相应方向大小是否吻合。比如
输出结果
或者
输出结果
如果是一个 vector 和一个 ndarray 想合并,可以给 vector 增加一个维度
输出结果
2.5. DataFrame
DataFrame 比较灵活,可以在各个维度上进行扩展。所以连接的时候需要特别注意方向。
输出结果
3. 总结
今天我们大致总结了 Python 里面常见数据类型的合并方式。合并是最常见的数据操作之一,应该是熟练掌握的基本功之一。
相关代码均已上传到 Data2Science@Github (https://github.com/jetorz/Data2Science),欢迎标记 Star。
4. 交流
独学而无友则孤陋寡闻。现有「数据与统计科学」微信交流群,内有数据行业资深从业人员、海外博士、硕士等,欢迎对数据科学、数据分析、机器学习、人工智能有兴趣的朋友加入,一起学习讨论。
大家可以扫描下面二维码,添加荔姐微信邀请加入,暗号:机器学习加群。
Lily
5. 扩展
5.1. 延伸阅读
5.2. 参考文献
[1]M. Wes, Python for Data Analysis, 2nd. Beijing: O’Reilly, 2017.
[1]J. VanderPlas, Python Data Science Handbook. Beijing: O’Reilly, 2016.
Data2Science
本文使用 mdnice 排版
版权声明: 本文为 InfoQ 作者【张利东】的原创文章。
原文链接:【http://xie.infoq.cn/article/19fe9f348180a4a947441d5bf】。文章转载请联系作者。
评论