架构师训练营 Week 13 [命题 + 总结]
作业一:
Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
首先引入两个概念:
链出:此网页中包涵的指向其他网页的链接
链入:其他网页中包涵的指向该网页的链接
最初的简易模型:
假设每个网页都是健康友好的状态,有必要的链出,也有正常的链入,如下图所示:
ABCD代表4个页面,每个页面赋予权值1,如页面A有三个指向其他页面的链接表示页面A链出3次,被链入的页面BCD分别获得页面A给予的1/3的权值。
我们现在站在被链入的角度去看待一个页面(这也是计算一个页面排名的角度),比如A。
A-->A,给予0的权值
B-->A,给予1/2的权值(另外1/2给了D);
C-->A,给予 1的权值
D-->A,给予0的权值
所以在所有页面的集合中,A一共获得了2个链入,获得的权值总和
第一次w1乘以每个页面被链入(点击)的概率
以后再以实际权重分布M为基础,不断乘以新的一轮的4个页面被链入的概率,进行N此迭代之后直到w稳定趋于某个值,即基本确定每一个页面在实际操作中被链入的概率,即影响力。
随机浏览模型:
作业二:
根据当周学习情况,完成一篇学习总结
版权声明: 本文为 InfoQ 作者【莫莫大人】的原创文章。
原文链接:【http://xie.infoq.cn/article/854acf2c2166fbed6c510bd26】。文章转载请联系作者。
评论