架构师训练营第 13 周课后练习
题目
1.你所在的行业,常用的数据分析指标有哪些?请简述。
2.Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
解答
1.数据分析指标主要有两种,一种是技术指标,比如接口异常数,接口响应时间等,可以从日志中分析得到。还有一种是业务指标,比如我们公司做了一个大屏应用,上面展示一些税务风险人数,应对成效情况等数据。
2.PageRank是一种网页排序算法。一个网页的得票数(PageRank值)由所有链向它的页面的重要性决定。初始化所有页面的PageRank值都为1,通过若干轮的计算,会得到每个页面的最终PageRank值。
下一轮的PageRank值是所有指向它的页面PageRank值除以出链数量相加得到。因为存在一个网页只有对自己出链,或者几个网页出链形成一个循环圈。所以在这个公式上引入了一个参数α,α代表这个其他网页通过链接跳转到该页面的概率,默认值是0.85,计算PageRank值是要乘以α,再加上跳转到其他网页概率1-α除以网页数量。通过这个公式递归计算,最终会得到一个趋于稳定的值。
评论