写点什么

来,带你一次性搞懂数据分析和数据挖掘!

  • 2021 年 11 月 11 日
  • 本文字数:1593 字

    阅读完需:约 5 分钟

一直都有很多朋友想要学习数据分析,希望小编可以推荐一些靠谱的书。

大家要么是看到了数据的重要性,想要转行做数据分析师,要么是本职工作需要,想要学习一些数据分析相关的知识来赋能自己的工作。

无论怎样,数据分析这项技能真的是被越来越多的人所需要,而对于在职场上的发展有更高追求的小伙伴,更是有深入学习数据挖掘的打算!

那么,数据分析与数据挖掘之间有怎样的关系?有了数据分析基础是否可以更容易上手数据挖掘?在学习路径方面又需要注意些什么呢?



数据分析是指用适当的统计方法对收集的海量数据进行分析、提取有用的信息和形成结论,然后对数据加以详细研究和概括总结的过程。

有些人将数据分析划分为描述性数据分析、探索性数据分析和验证性数据分析。 

其中,探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分 析则侧重于对已有假设的证实或证伪。



数据挖掘一般是指从海量的数据中通过相应的算法,挖掘其中有价值(未知的、有规律的)的信息的复杂过程。



许多人把数据挖掘看作另一个常用的术语“KDD (Knowledge Discovery in Database)”的同义词,而还有一些人只是把数据挖掘看作 KDD 过程中的一个基本步骤。

KDD 可直译为“基于数据库的知识发现”(简称“知识发现”),是指从海量的数据中提取有效的、新颖的、 潜在有用的、最终可被理解的模式的过程,如下图所示为 KDD 过程。



数据挖掘是深层次的数据分析,数据分析是浅层次的数据挖掘,数据挖掘更偏重于探索性数据分析,因为数据挖掘的重点是从数据中发现知识规律。

它们的具体区别如下: 

(1)数据分析处理的数据量可能不大;而数据挖掘处理的数据量极大, 并且特别擅长处理大数据,尤其是几十万行、几百万行,甚至更多的数据。

(2)数据分析往往是从一个假设出发,需要自行建立方程或模型来与假设吻合;而数据挖掘不需要假设,可以自动建立方程,比如关联规则和聚类分析。

(3)数据分析往往处理数值型数据;而数据挖掘能够处理不同类型的数据,比如声音、文本等。 

(4)数据分析主要侧重于通过观察数据来对历史数据进行统计学分析;而数据挖掘通过从数据中发现“知识规律”来对未来的某些可能性做出预测分析,其更注重分析数据间的内在联系。

(5)数据分析与数据挖掘的区别更多地体现在职业方向上。相对数据挖掘工程师,数据分析师与业务方的工作衔接更多,理解与梳理业务诉求、 明确业务目的和指导模型搭建是数据分析师的主要工作;而模型搭建与参数调优则是数据挖掘工程师的工作。


其实,在很多情况下,数据分析与数据挖掘是“同源同根”的。也就是说,数据分析与数据挖掘没有明确的界限。

如果想从数据中提取一定的规律(即认知),则往往需要将数据分析和数据挖掘结合使用。因为在计算机中,数据都是以 0 和 1 的形式进行存储的,从这个层面上讲,数据分析的范畴更大一些。

而在以上区别(5)中所说的两者不同的分工也是在大公司中会分得比较明确,如果是在中小公司中,(5)中所说的工作都是由一个人完成的。

所以,想要学习数据挖掘肯定还是需要有相关的数据分析基础。



那么,怎样可以高效快速地掌握数据分析和数据挖掘呢?

大家在搜索学习方法时,肯定会发现要学习的东西很多,不仅要掌握分析工具、分析语言,还要学习统计学、机器学习算法等等。

虽然这些确实是需要掌握的内容,但也都只是实现某种业务目的的工具。想要真正做好数据分析和数据挖掘,使其真正赋能实际业务,具备良好的数据思维才是关键。

《数据分析与挖掘算法:Python 实战》一书便深刻阐述了数据思维的重要性,并将数据思维上升到哲学高度。

此外,本书也对从数据处理到数据分析进行了全流程说明,对经典的数据挖掘算法从理论到 Python 实践逐步深入讲解,使读者不仅知其然知其所以然,也使读者可以联系生活中的例子进行实操。



一本书,讲明了数据分析与挖掘的重点,帮你从底层扎实地建立起知识框架,带你快速体验实践数据分析与挖掘的乐趣,非常值得想要学习数据分析与挖掘的读者入手!



用户头像

还未添加个人签名 2019.10.21 加入

还未添加个人简介

评论

发布
暂无评论
来,带你一次性搞懂数据分析和数据挖掘!