week-13- 作业一
1、你所在的行业,常用的数据分析指标有哪些?请简述。
所在的行业是自动化测试行业,经常分析的数据分析指标有:接口参数覆盖率、用例构建效率、用例执行通过率、用例执行效率;
接口参数覆盖率:用例设计时覆盖多少个参数,用例才完整;
用例构建效率:用例构建效率的统计;
用例执行通过率:用例执行完后,统计多少案例成功、失败;
用例执行效率:执行一批案例需要多少时间;
2、Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
PageRank 算法是 Google 公司创办人拉里·佩奇之性来命名。
PageRank 算法使用超链接关系来确定一个页面的等级,计算投票数量,比如 A 页面有链接到 B 页面,即被认为是 A 页面给 B 页面投票。得到票数越高则排名越靠前。
到一个页面的每一个超链接相当于对该页面投了一票,一个页面如果有较多链入的页面,就会有较高的等级,如果一个都没有,则没有等级。
全世界有万亿级别的网页,计算每个页面的票数需要递归算法处理。
架设一个由 4 个页面组成的小团队:A,B,C 和 D。如果所有页面都链向 A,那么 A 的 PageRank 值将是 B,C 及 D 的 PageRank 总和。
如果一个页面链出到 2 个页面,因为一个页面不能投票 2 次,所以这个页面给这 2 个页面各半票。
还联网中一个网页如果对自己出链,或者几个网页出链形成一个循环,那么这一个或几个网页的 PageRank 值将是不合理的。
现实情况是,全世界的网页是万亿级,因此需要应用大数据工具,按以下公式进行计算。
评论