架构师训练营第十三周作业 2
根据当周学习情况,完成一篇学习总结
这周继续学习大数据的相关技术。学习了 Spark 技术,相比 hadoop,spark 速度更快,spark 主要是采用 DAG 切分的多阶段计算过程更快速,使用内存存储中间计算结果更高效,RDD 的编程模型更简单。目前 Spark 的应用比较广泛。
这周还简单学习了其他大数据工具,Storm,flink,spark streaming,Hibench 的基本概念。另外还学习了网页排名 Pagerank 算法的原理。还有各个分类算法,Knn 分类算法,TF_IDF 算法,贝叶斯分类算法,kmeans 聚类算法,推荐引擎算法。还学习了机器学习系统架构。由于以前做过相关工作,所以这块比较熟悉。
评论