13.4 大数据基准测试工具 HiBench
1.基准测试解决的问题
1.1 大数据从哪里来?怎么构建大数据?
1.2 常用大数据算法,运行起来测试集群的性能。集群的处理能力如何?能不能满足需要?
HiBench 是 Intel 开放的一个 Hadoop Beanchmark Suit,包含 9 个典型的 Hadoop 负载
Micro benchmarks
Sort
wordCount
TeraSort
HDFS benchmarks
DFSIO(吞吐能力测试)
web search beanchmarks
Nutch indexing(搜索引擎测试)
PageRank
machine learning beanchmarks(机器学习)
Mahout Bayesian Classification(分类算法)
Mahout K-means clustering(聚类算法)
data analytis benchmarks
Hive Query Benchmarks(Hive 查询基准)
主页是:https://github.com/intel-hadoop/hibench
评论