文本统计分析
0 人感兴趣 · 1 次引用
- 最新
- 推荐
在 Hadoop 环境里面统计西游记文章的词组(hdfs 实验)
在Hadoop的环境里面我们测试一个文件,对西游记这个书籍里面的所有词语,进行统计排序。hadoop包括两个核心组成:HDFS:分布式文件系统,存储海量的数据MapReduce:并行处理框架,实现任务分解和调度。
0 人感兴趣 · 1 次引用
在Hadoop的环境里面我们测试一个文件,对西游记这个书籍里面的所有词语,进行统计排序。hadoop包括两个核心组成:HDFS:分布式文件系统,存储海量的数据MapReduce:并行处理框架,实现任务分解和调度。