如何入门数据分析?
如今,大多数公司都意识到数据驱动的商业策略的价值,因此需要有数据分析才能的人来洞察不断收集的信息。随着我们继续将现实世界数字化,对分析师的需求只会增加。 可以了解之前讲解的《数据分析为什么火了》。
如果你刚开始学习数据分析,那么怎么入门呢?其实各大招聘网站的数据分析职位就是一个很好的参考。那么数据分析师究竟需要哪些技能呢?
数据分析必备技能:
Excel
SQL
Python 或者 R
数据可视化
机器学习
PPT
逻辑思维
下面我们一个个看下
一、Excel
说到 Excel,首先想到的可能是电子表格,但是这个工具背后有更多的分析能力,如编写宏和使用 VBA 查找,这样的高级 Excel 方法在处理小数据量时更轻松、快速的分析。比如散点图可以很方便的帮助我们发现数据分布特征,Excel 甚至可以做线性回归。因为 Excel 受数据量的影响,所以学习一门数据处理语言是非常有必要的。
二、SQL
SQL 是普遍存在的行业标准数据库语言,是数据分析师需要掌握的最重要的技能。这种语言通常被认为是 Excel 的“终极”版本,它能够处理 Excel 无法处理的大型数据集。
几乎每个数据分析组织都至少需要一个了解 sql 的人,更需要一个数据仓库团队。以前很多行业的业务逻辑全写在数据库存储过程中,那时候,只会写 SQL 就可以拿高薪。现在很多大数据计算引擎也都支持了 SQL 操作,所以你想使用大数据,那么学习 SQL 是第一步。
三、Python 或者 R
任何 Excel 能做的事情,R 或 Python 都能做得更好,甚至要快 10 倍。和 SQL 一样,R 和 Python 可以处理 Excel 不能处理大数据量的事情。它们是强大的统计编程语言,用于对大数据集执行高级分析和预测分析。要成为一名真正的数据分析师,您需要超越 SQL 并至少掌握其中一种语言。
那么你应该学习哪一个呢?R 和 Python 都是开源和免费的,公司招聘一般也是写明,会其中一个就可以。但是,由于 Python 现在有很多工具包,而且机器学习和深度学习也都和 Python 联系紧密,所以推荐大家优先学习 Python。
四、数据可视化
为什么要掌握可视化,举个例子。
你在买水果的时候肯定关系水果是不是坏的,你一看就知道,数据也一样,你可以通过可视化很快的发现异常数据、脏数据。
同样,厨师们除了要保证菜好吃,还要把菜做的好看,这样客人们才会更加满意,原因买单。数据分析的内容再好,最后都要可视化出来,让老板能看懂,这样才能升值加薪啊!
可见,可视化能够用数据讲述一个引人注目的故事,让你的观点更易被人理解。分析师使用吸引眼球的、高质量的图表和图形,以清晰简洁的方式展示分析的发现。所以,去学习 Python 的 Matplotlib 和 Seaborn 吧,可以参考之前的文章讲解《数据挖掘从入门到放弃(五)seaborn 的数据可视化》。
五、机器学习
现在 AI 和预测分析是数据科学领域最热门的两个主题,数据分析师不只是单单对历史数据的统计操作了,对机器学习的理解已被确定为分析师的工作之一。虽然并不是每个分析师都使用机器学习,但是为了在这个领域要走的更远,学习机器学习是很重要的。然而机器学习需要一定的统计学知识,需要理解算法的原理,然后才能更好的使用。可以参考文章结尾的历史文章精选。
六、PPT
数据可视化和 PPT 是相辅相成的。但是我们每个人基本都是程序员出身,不屑于写 PPT。但是你不能拿着代码给老板汇报吧。PPT 可以很好帮助你表达清楚自己的分析思路和分析结论,也帮让老板理解。但是 PPT 并不是直接把 word 粘贴过来,PPT 最主要的是图,字不用太多,因为 PPT 是用来讲解的,不是需求文档!
关于 PPT,还是要多谢,写的多了,被老板批评的多了,自然就会了……
七、逻辑思维能力
使用数据来找到问题的答案,意味着首先你要弄清楚要什么,也就是用户故事要想好。数据分析师的角色是发现并关联那些并不总是很清晰的联系。这个比以上 6 条都难,我遇到过有些分析师用机器学习或者深度学习跑出一些结果,最后告诉老板,结果是模型学习的,是不可解释的。我承认,比如神经网络跑出来的结果,很难解释。但是我们是数据分析师,不是算法工程师,我们首先要考虑的就是分析结果和我们之前的用户故事有什么联系,我们要找到这部分联系,解释给老板。那么如何来培养这种能力呢?比如问自己最初的用户故事是什么,怎么来的,联系当前的业务知识,看看结果和分析需求的哪个节点能联系起来,是否能够使用起初的用户故事。经常这样思考,可以帮助你在寻找解决方案时保持清醒,而不是被一个很难解释搞蒙。
结尾
如果你想进入数据分析这个行业,那么就从上述 7 个技能开始吧。
关注公众号【数据社】,回复【资料】,获取大数据学习资料。
版权声明: 本文为 InfoQ 作者【数据社】的原创文章。
原文链接:【http://xie.infoq.cn/article/01bfc61d75bb54e5904a5c2d8】。文章转载请联系作者。
评论