机器学习和大数据的区别和联系
首先,回顾大数据的 4V 特征:
1.数据量大
2.数据种类多
3.速度快
4.价值密度低
大数据框架实现基础的数据存储和数据计算,如果从大量的数据中发现和挖掘出有价值的信息,需要借助机器学习算法,结合数据,构建机器学习模型实现对现实事件的预测。不同于以往的硬编码规则的方式,机器学习是通过机器学习算法发现或挖掘出数据中存在的规律或模式。
试想这样一个场景,傍晚小街路面上沁出微雨后的湿润,和煦的细风吹来,抬头看看天边的晚霞。心里想着明天又是一个好天气。走到水果摊旁,挑了个色泽青绿、敲起来声音浊响的青绿西瓜,一边期待着西瓜皮薄肉厚瓤甜的爽落感,一边愉快地想着,明天学习 Python 机器学习一定要狠下功夫,基础概念搞得清清楚楚,案例作业也是信手拈来,我们的学习效果一定差不了。希望大家在学习完之后有这样的感觉,我们首先大致了解什么是“机器学习”(machine learning)。回想刚刚我们买西瓜的场景,我们会发现这里涉及很多基于经验做出的预判。(1)为什么看到微湿路面、感到和风、天边晚霞就认为明天是好天呢?答:这是因为在我们的生活经验中已经遇见过很多类似的情况,前一天观察到上述特征后,第二天天气通常会很好。(2)为什么色泽青绿、敲声浊响就能判断出是正熟的好西瓜呢?答:这是因为我们吃过、看过很多的西瓜,所以基于色泽、敲声这几个特征我们就可以做出相当好的判断。
再进一步深入机器学习概念之前首先了解下机器学习或人工智能在当下的应用场景。首先,人工智能对我们未来生活的改变,大家试想几年后,人工智能将可能取代世界上 90%的岗位:
人工智能不是模仿人类,而通常是超越人类。我们试想几年后我们能够每天自我对弈 100 万盘棋,并从中学习的 AlphaGO 吗?随着人工智能的发展,人工智能的热门方向和应用越来越多,如下图,这里总结六个方面:
机器学习三次浪潮
机器学习的三次浪潮也可以说是人工智能的三次浪潮,因为机器学习是人工智能(Artificial Intelligence)研究发展到一定阶段的必然产物。
1956 Artificial Intelligence 提出 1956 年夏季,以麦卡赛、明斯基、罗切斯特和申农等为首的一批有远见卓识的年轻科学家在一起聚会,共同研究和探讨用机器模拟智能的一系列有关问题,并首次提出了“人工智能”这一术语,它标志着“人工智能”这门新兴学科的正式诞生。IBM 公司“深蓝”电脑击败了人类的世界国际象棋冠军更是人工智能技术的一个完美表现。人工智能的目的就是让计算机这台机器能够像人一样思考。
1950-1970 符号主义流派:专家系统占主导地位 1950:图灵设计国际象棋程序 1962:IBM Arthur Samuel 的跳棋程序战胜人类高手(人工智能第一次浪潮)
1980-2000 统计主义流派主要用统计模型解决问题 Vapnik 19931997:IBM 深蓝战胜卡斯帕罗夫(人工智能第二次浪潮)
2010-至今神经网络、深度学习、大数据流派 Hinton 20062016:Google AlphaGO 战胜李世石(人工智能第三次浪潮)
刚才说到我们三次浪潮,前两次每次都是这样,说人类要毁灭了,后来发现其实并不是这样。我们现在就处在这个状态,人类又要毁灭了。其实和前两次比,还是有一点区别。
最大的一个区别就是它现在真的是深入到我们生活的每一个角落,打开你的手机看看,淘宝,智能推荐,拍一拍,谷歌翻译,搜索引擎,智能出行,智能规划,微信,智能助理,头条,智能推荐,还有机器识别,其实它已经深入的改变了我们生活的每一个角落,而将来它会改变更多。
版权声明: 本文为 InfoQ 作者【大数据技术指南】的原创文章。
原文链接:【http://xie.infoq.cn/article/d171b62de4be2834d9092bcb2】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论