Python 深度集成的神器级 IDE,从此告别 Excel!,成为阿里 P7Python 架构师到底有多难
Grid Studio 主要要解决的问题是如何在开发数据科学项目时不需要在各种工具(比如 R Sudio、Excel)之间切来切去,因为那种体验实在太糟糕了。
在导出 CSV 文件时,因为行数太多或者尝试读取 JSON 文件会导致应用程序窗口没有响应。现有的工具无法提供高效的开发环境和工作流。
于是,Rick 决定开发一个工具,把他的工作流集成在一起,可以方便地应对各种项目。
Grid Studio 的工作原理
Grid Studio 是一款基于 Web 的应用程序,看起来和 Google Sheets 或 Excel 很像。不过,它的杀手锏特性是与 Python 的深度集成。
你可以直接用它查看和编辑表格结构的数据,也可以直接在上面编写和执行 Python 代码。
在 Grid Studio 中可以直接通过 Python 读写电子表格。
要向表格中写入数据,可以这样:
sheet("A1:A3", [1, 2, 3])
要从表格中读取数据,可以这样:
my_matrix = sheet("A1:A3")
这些简单的函数可以实现数据的自动录入、抽取、可视化,等等。
编写自定义函数
虽然上述的读写函数已经可以满足很多需求,但有时候也需要编写自定义函数,然后在表格中调用这些函数。
Grid Studio 默认支持常用的表格函数,比如 AVERAGE、SUM、IF,等等。但如果你想要使用其他函数,那该怎么办?
自己动手写!
def UPPERCASE(a): return str(a).uppercase()
然后就可以在表格中调用这个函数,就像调用常规的函数一样。
利用 Python 生态系统
Python 生态系统提供了很多非常棒的数据科学开发工具:
借助这些工具可以很容易地使用强大的模型,比如线性回归和 SVM。
Docker 运行时
Grid Studio 运行在 Docker 容器中,可以很方便地访问 UNIX 环境(甚至是 Windows!)中的东西:Python、scikit-learn、numpa、pandas、terminal、wget、zip,等等。
Grid Studio 提供了预先构建好的 Docker 镜像,可以通过简单的命令行来启动。
数据可视化
数据可视化是数据科学的一项常见任务。Grid Studio 与 Plotly.js 和 Matplotlib 深度集成,为高级数据可视化提供了内置支持。
为了演示 Grid Studio 的功能,接下来将提供一些具体的例子。
示例:爬取网络内容
之前爬取网络内容可能需要在各种工具之间切换,现在只需要一个脚本就够了。
在上面的示例中,一个简短的脚本直接将 Hacker News 网站的文章加载到表格中。
脚本地址:
https://github.com/ricklamers/gridstudio/blob/master/examples/scrape.py
示例:估计正态分布
这个例子演示了使用 Plotly.js 进行高保真正态分布估计,交互式绘图让你对正在发生的事情一目了然。
脚本地址:
https://github.com/ricklamers/gridstudio/blob/master/examples/estimate_normal.py
(1)Python 所有方向的学习路线(新版)
这是我花了几天的时间去把 Python 所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
最近我才对这些路线做了一下新的更新,知识体系更全面了。
(2)Python 学习视频
包含了 Python 入门、爬虫、数据分析和 web 开发的学习视频,总共 100 多个,虽然没有那么全面,但是对于入门来说是没问题的,学完这些之后,你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。
(3)100 多个练手项目
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了,只是里面的项目比较多,水平也是参差不齐,大家可以挑自己能做的项目去练练。
评论