架构师训练营第 13 周课后练习
你所在的行业,常用的数据分析指标有哪些?请简述。
Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
一、常用数据分析指标:
平均数(average)
百分比(percentage)与百分点(percentage point)
比例(proportion)和比率(ratio)
字段与记录
二、
PageRank算法的主要思想是:越“重要”的网页,页面上的链接质量也越高,同时越容易被其它“重要”的网页链接。于是,算法完全利用网页之间互相链接的关系来计算网页的重要程度,将网页排序彻底变成一个数学问题,终于摆脱了访问量统计的框框。
我们将互联网想象成一个流网络,网络的节点就是一个个网页,如果两个网页间存在超链接的关系,那么它们之间就存在一条有向的连边。想象存在一种货币,它们在这个流网络上随机地流动,在任意时刻,每个网页上都会有货币流入,也会有货币流出,当最终达到稳定时,将每个网页持有的货币存量,或者说「财富」的多寡由大到小排序,就得到了网页重要性的排序PageRank。我们发现排在前面的主要是被较多引用的网页,当然有幸被重要网页引用的网页也会得到较大的PageRank值。
评论