架构师训练营 -week13- 作业
本周作业:
你所在的行业,常用的数据分析指标有哪些?请简述。
Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
作业1:
业务数据主要有:
每日销量/当月累计销量/当年累计销量
当月累计销量同比增长率
当年累计销量同比增长率
月累计销量环比增长率
技术数据主要有:
每日和每月接口调用总数 / 平均时长 / 99线 / 95线
接口调用成功率
接口调用各个业务占比
运维数据主要有:
事件解决率 / 事件处理平均响应时间 / 突发事件完成率
紧急变更率 / 变更成功率 / 平均变更时间
作业2:
PageRank 算法目的就是要找到优质的跟搜索结果匹配的网页,这样 Google 的排序结果不仅能找到用户想要的内容,而且还会从众多网页中筛选出权重高的呈现给用户。
PageRank通过网络浩瀚的超链接关系来确定一个页面的等级。Google把从A页面到B页面的链接解释为A页面给B页面投票,Google根据投票来源(甚至来源的来源,即链接到A页面的页面)和投票目标的等级来决定新的等级。过程如下:
假设全世界有N个网页,每个页面包含x个外链,每个页面有个初始的PR值。
存在一定概率为α,用户在地址栏输入A/B/C/D地址,然后从C跳转到A/B/C/D进行浏览。α=0.85,表示每个页面85%的概率是从其他页面跳过来的,那15%的概率是用户在浏览器手输地址跳转过来的:PR(A)=α∗(PR(B)/2)+(1−α)/4
一个页面的PR值理论上是由0.15/N+其他能跳转过来的所有页面的PR值*0.85再分一部分过来
我们根据初始的PR值,再约定一个迭代次数进行迭代(或者迭代直到计算后PR值比上一轮迭代的差异很小为止)
评论