写点什么

架构师训练营 -week13- 作业

用户头像
大刘
关注
发布于: 2020 年 12 月 19 日
架构师训练营 -week13-作业
本周作业:
  • 你所在的行业,常用的数据分析指标有哪些?请简述。

  • Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)


作业1:
  • 业务数据主要有:

  1. 每日销量/当月累计销量/当年累计销量

  2. 当月累计销量同比增长率

  3. 当年累计销量同比增长率

  4. 月累计销量环比增长率

  • 技术数据主要有:

  1. 每日和每月接口调用总数 / 平均时长 / 99线 / 95线

  2. 接口调用成功率

  3. 接口调用各个业务占比

  • 运维数据主要有:

  1. 事件解决率 / 事件处理平均响应时间 / 突发事件完成率

  2. 紧急变更率 / 变更成功率 / 平均变更时间

作业2:
  • PageRank 算法目的就是要找到优质的跟搜索结果匹配的网页,这样 Google 的排序结果不仅能找到用户想要的内容,而且还会从众多网页中筛选出权重高的呈现给用户。

  • PageRank通过网络浩瀚的超链接关系来确定一个页面的等级。Google把从A页面到B页面的链接解释为A页面给B页面投票,Google根据投票来源(甚至来源的来源,即链接到A页面的页面)和投票目标的等级来决定新的等级。过程如下:

  • 假设全世界有N个网页,每个页面包含x个外链,每个页面有个初始的PR值。

  • 存在一定概率为α,用户在地址栏输入A/B/C/D地址,然后从C跳转到A/B/C/D进行浏览。α=0.85,表示每个页面85%的概率是从其他页面跳过来的,那15%的概率是用户在浏览器手输地址跳转过来的:PR(A)=α∗(PR(B)/2)+(1−α)/4

  • 一个页面的PR值理论上是由0.15/N+其他能跳转过来的所有页面的PR值*0.85再分一部分过来

  • 我们根据初始的PR值,再约定一个迭代次数进行迭代(或者迭代直到计算后PR值比上一轮迭代的差异很小为止)





用户头像

大刘

关注

大道至简,知易行难 2017.12.27 加入

想成为合格架构师的架构师

评论

发布
暂无评论
架构师训练营 -week13-作业