写点什么

架构师训练营第 13 周课后练习

用户头像
关注
发布于: 2020 年 12 月 19 日
  • 你所在的行业,常用的数据分析指标有哪些?请简述。

  • Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)

一、常用数据分析指标:

平均数(average)

百分比(percentage)与百分点(percentage point)

比例(proportion)和比率(ratio)

字段与记录



二、

PageRank算法的主要思想是:越“重要”的网页,页面上的链接质量也越高,同时越容易被其它“重要”的网页链接。于是,算法完全利用网页之间互相链接的关系来计算网页的重要程度,将网页排序彻底变成一个数学问题,终于摆脱了访问量统计的框框。



我们将互联网想象成一个流网络,网络的节点就是一个个网页,如果两个网页间存在超链接的关系,那么它们之间就存在一条有向的连边。想象存在一种货币,它们在这个流网络上随机地流动,在任意时刻,每个网页上都会有货币流入,也会有货币流出,当最终达到稳定时,将每个网页持有的货币存量,或者说「财富」的多寡由大到小排序,就得到了网页重要性的排序PageRank。我们发现排在前面的主要是被较多引用的网页,当然有幸被重要网页引用的网页也会得到较大的PageRank值。



用户头像

关注

还未添加个人签名 2018.09.02 加入

还未添加个人简介

评论

发布
暂无评论
架构师训练营第 13 周课后练习