写点什么

文本统计分析

0 人感兴趣 · 1 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/9f/9f79347afebc4259d61717f2ab089eee.gif?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

在 Hadoop 环境里面统计西游记文章的词组(hdfs 实验)

用户头像
王小王-123
2022-06-29

在Hadoop的环境里面我们测试一个文件,对西游记这个书籍里面的所有词语,进行统计排序。hadoop包括两个核心组成:HDFS:分布式文件系统,存储海量的数据MapReduce:并行处理框架,实现任务分解和调度。

文本统计分析_文本统计分析技术文章_InfoQ写作社区