ARTS 第四周 6.15-6.21

发布于: 19 小时前

Algorithm

力扣55.跳跃游戏

理解题意之后,我想到的解法是从后往前遍历,只寻找0,没找到往前找,找到的话在接下来遍历过程中判断是否有可以越过这个0的位置及值。写完代码之后,发现了很多问题,修修补补完,运行时间让我不太满意。

最终看了题解部分大神们的解答,发现如下这个非常简洁的写法,自愧不如。copy学习致上敬意。

class Solution:
def canJump(self, nums: List[int]) -> bool:
farthest = 0
for i, num in enumerate(nums):
if farthest < i: return False
farthest = max(farthest, i+num)
return farthest >= i

Review

10 Mistakes I’ve Made as a Data Scientist

作者是一名数据科学家,文中基于作者个人经验分享了作者认为数据科学家在工作中比较重要的十点tips。

我从中学到的最重要一点是:不要过度依赖 jupyter notebook,虽然它非常方便好用,但工业级代码需要以.py文件的形式储存、并且是面向对象编程的。另外,优秀的代码注释以及测试单元也非常重要,这会为之后的工作奠定很好的基础。最后就是要注意数据科学家的技能图谱,要注意软技能的提升并且持续学习。

Tips

在用Python读取处理gb级数据的时候,简单read_csv让内存爆炸;百度后,用到read_csv中的参数chunksize,将原数据分块读取,降低内存消耗。实操时有个问题,Google以及查阅官方文档之后没有找到有效处理办法:我的数据本身有1130000+条,分块大小设置为100000,按理说有12个块,但操作的时候,第12个块(也就是最后三万多条数据)报错,根据Google尝试

error_bad_lines=False
quoting=csv.QUOTE_NONE

两种方法后无效果,所以现在我只能手动去get_chunk最后的三万多条了。

Share

97 | 高效学习:源头、原理和知识地图

这篇文章第一部分就让我读的很兴奋,因为这句话:“我觉得,只要我有时间,极客时间上的所有专栏都不用写了,我一个人就 OK 了。我可以写得又快又好,而且超出所有的人。”

这句话实在霸气,耗子叔随后给出了解释:“我想通过这些简单链接的方式,为我的读者打开一个全新的世界,他们可以在这个世界中自己找食吃,而不需要依赖我,这才是我想给大家带来的东西。”

耗子叔说的没错,我们要想不断学习,就得学会学习,同时,扎实的基础和好的知识结构是所谓“快速学习”的根本。

用户头像

我笔盒呢

关注

还未添加个人签名 2019.01.07 加入

还未添加个人简介

评论

发布
暂无评论
ARTS 第四周 6.15-6.21