写点什么

第 13 周总结:Spark& 流计算,数据分析和机器学习

用户头像
hifly
关注
发布于: 2020 年 09 月 09 日
第13周总结:Spark&流计算,数据分析和机器学习

Spark为什么比MapReduce更快,老师课程上讲了三点:1)DAG切分的多阶段计算过程更快速 2)使用内存存储中间计算结果更高效 3)RDD的编程模型更简单。其中RDD(弹性数据集)即是Spark面向开发者的编程模型,又是Spark自身架构的核心元素。



流计算的框架主要有三个:Hadoop的Storm,Spark Streaming, Flink。



数据分析和机器学习的内容总结成了下面的思维导图。





用户头像

hifly

关注

还未添加个人签名 2018.03.08 加入

还未添加个人简介

评论

发布
暂无评论
第13周总结:Spark&流计算,数据分析和机器学习