架构师训练营 Week 13 [命题 + 总结]

用户头像
莫莫大人
关注
发布于: 2020 年 09 月 09 日
架构师训练营 Week 13 [命题 + 总结]

作业一:

Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)

首先引入两个概念:

  • 链出:此网页中包涵的指向其他网页的链接

  • 链入:其他网页中包涵的指向该网页的链接

最初的简易模型:

假设每个网页都是健康友好的状态,有必要的链出,也有正常的链入,如下图所示:

ABCD代表4个页面,每个页面赋予权值1,如页面A有三个指向其他页面的链接表示页面A链出3次,被链入的页面BCD分别获得页面A给予的1/3的权值。

我们现在站在被链入的角度去看待一个页面(这也是计算一个页面排名的角度),比如A。

A-->A,给予0的权值

B-->A,给予1/2的权值(另外1/2给了D);

C-->A,给予 1的权值

D-->A,给予0的权值

所以在所有页面的集合中,A一共获得了2个链入,获得的权值总和

第一次w1乘以每个页面被链入(点击)的概率



以后再以实际权重分布M为基础,不断乘以新的一轮的4个页面被链入的概率,进行N此迭代之后直到w稳定趋于某个值,即基本确定每一个页面在实际操作中被链入的概率,即影响力。

随机浏览模型:



作业二:

根据当周学习情况,完成一篇学习总结



发布于: 2020 年 09 月 09 日 阅读数: 23
用户头像

莫莫大人

关注

还未添加个人签名 2018.07.31 加入

还未添加个人简介

评论

发布
暂无评论
架构师训练营 Week 13 [命题 + 总结]