week12-conclusion
本周对大数据技术的应用做了入门介绍。
HDFS 是当前很多开源大数据技术的基础,解决了海量数据的存储和读取。
在此之上产生了批处理计算技术 MapReduce、Spark,流处理计算技术 Storm、Flink、Spark Streaming,以及 NoSQL 系统 HBase、Cassandra 等。
有了这些计算技术,进而产生了大数据分析和数据仓库 Hive、Spark SQL,以及大数据挖掘和机器学习 Mahout、MLlib、TensorFlow。
本周对大数据技术的应用做了入门介绍。
HDFS 是当前很多开源大数据技术的基础,解决了海量数据的存储和读取。
在此之上产生了批处理计算技术 MapReduce、Spark,流处理计算技术 Storm、Flink、Spark Streaming,以及 NoSQL 系统 HBase、Cassandra 等。
有了这些计算技术,进而产生了大数据分析和数据仓库 Hive、Spark SQL,以及大数据挖掘和机器学习 Mahout、MLlib、TensorFlow。
评论