ARTS 第四周 6.15-6.21
Algorithm
力扣55.跳跃游戏
理解题意之后,我想到的解法是从后往前遍历,只寻找 0,没找到往前找,找到的话在接下来遍历过程中判断是否有可以越过这个 0 的位置及值。写完代码之后,发现了很多问题,修修补补完,运行时间让我不太满意。
最终看了题解部分大神们的解答,发现如下这个非常简洁的写法,自愧不如。copy 学习致上敬意。
Review
10 Mistakes I’ve Made as a Data Scientist
作者是一名数据科学家,文中基于作者个人经验分享了作者认为数据科学家在工作中比较重要的十点 tips。
我从中学到的最重要一点是:不要过度依赖 jupyter notebook,虽然它非常方便好用,但工业级代码需要以.py 文件的形式储存、并且是面向对象编程的。另外,优秀的代码注释以及测试单元也非常重要,这会为之后的工作奠定很好的基础。最后就是要注意数据科学家的技能图谱,要注意软技能的提升并且持续学习。
Tips
在用 Python 读取处理 gb 级数据的时候,简单 read_csv 让内存爆炸;百度后,用到 read_csv 中的参数 chunksize,将原数据分块读取,降低内存消耗。实操时有个问题,Google 以及查阅官方文档之后没有找到有效处理办法:我的数据本身有 1130000+条,分块大小设置为 100000,按理说有 12 个块,但操作的时候,第 12 个块(也就是最后三万多条数据)报错,根据 Google 尝试
两种方法后无效果,所以现在我只能手动去 get_chunk 最后的三万多条了。
Share
这篇文章第一部分就让我读的很兴奋,因为这句话:“我觉得,只要我有时间,极客时间上的所有专栏都不用写了,我一个人就 OK 了。我可以写得又快又好,而且超出所有的人。”
这句话实在霸气,耗子叔随后给出了解释:“我想通过这些简单链接的方式,为我的读者打开一个全新的世界,他们可以在这个世界中自己找食吃,而不需要依赖我,这才是我想给大家带来的东西。”
耗子叔说的没错,我们要想不断学习,就得学会学习,同时,扎实的基础和好的知识结构是所谓“快速学习”的根本。
评论