这份 Excel+Python 飞速搞定数据分析手册,简直可以让 Excel 飞起来
微软在 UserVoice 上运营着⼀个反馈论坛,每个⼈都可以在这⾥提交新点⼦供他⼈投票。票数最⾼的功能请求是“将 Python 作为 Excel 的⼀门脚本语⾔”,其得票数差不多是第⼆名的两倍。
尽管⾃2015 年这个点⼦发布以来并没有什么实质性进展,但在 2020 年年末,Python 之⽗ Guido van Rossum 发布推⽂称“退休太无聊了”,他将会加入微软。此事令 Excel ⽤户重燃希望。我不知道他的举动是否影响了 Excel 和 Python 的集成,但我清楚的是,为何⼈们迫切需要结合 Excel 和 Python 的⼒量,⽽你⼜应当如何从今天开始将两者结合起来。总之,这就是本手册的主要内容。
Python :它是⼀门通⽤编程语⾔,并且已然成为最受分析师和数据科学家⻘睐的编程语⾔。
如果把 Python ⽤到 Excel 上,那么你在各⽅⾯都能体会到 Python 带来的好处,⽆论是⾃动化 Excel,访问、准备数据集,还是执⾏数据分析、可视化数据。最重要的是,你可以在 Excel 之外重⽤你的 Python 技能。如果需要更⾼的算⼒,那么你可以轻易地将量化模型、模拟、机器学习应⽤程序迁移到云上——云端有⽆穷的计算资源在等着你。
手册目录:
限于文章篇幅原因,只能以截图的形式展示出来,有需要的小伙伴可以 点击这里获取!
第⼀部分 Python ⼊门
在介绍本书要⽤到的⼯具之前,我们⾸先会看看为什么 Python 能成为 Excel 的好搭档。随后,第⼀部分会介绍 Anaconda Python 发⾏版、Visual Studio Code 和 Jupyter 笔记本。在这⼀部分中,我会教给你⾜够的 Python 知识,以便你掌握本书的剩余部分。
开发环境
数据结构
第⼆部分 pandas ⼊门
pandas 是值得信赖的 Python 数据分析库。我们会了解如何利⽤Jupyter 笔记本和 pandas 来替代 Excel ⼯作簿。pandas 的代码通常更易于维护,并且效率⽐ Excel ⼯作簿更⾼。不仅如此,你还可以⽤它来操作⼀张⼯作表放不下的数据集。和 Excel 不同,pandas 让你的代码可以在任何环境中运⾏,包括云端。
NumPy ⼊门
DataFrame 和 Series
第三部分 在 Excel 之外读写 Excel ⽂件
这⼀部分讲的是如何运⽤ Python 包来操作 Excel ⽂件,⽐如 pandas、OpenPyXL、XlsxWriter、pyxlsb、xlrd 和 xlwt。这些包能够代替 Excel 直接读写磁盘上的 Excel ⼯作簿,也就是说,你不需要实际安装 Excel 就能进⾏这些操作。这些包可以在任何⽀持 Python 的平台上⼯作,包括 Windows、macOS 和 Linux。对于读取 Excel⽂件的包来说,⼀个典型⽤例就是每天早上你⽤它读取从其他公司或者外部系统发来的 Excel ⽂件中的数据,然后将这些数据存储在数据库中。⽽对于写⼊ Excel ⽂件的包来说,你在各种应⽤程序中都能看到的“导出为 Excel ⽂件”按钮,背后就是它的功劳。
第四部分 使⽤ xlwings 对 Excel 应⽤程序进⾏编程
限于文章篇幅原因,就展示到这里了,有需要的小伙伴可以 点击这里获取!
评论