架构师训练营作业 -- Week 13

用户头像
吴炳华
关注
发布于: 2020 年 09 月 07 日
架构师训练营作业 -- Week 13

Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)

PageRank 是有拉里·佩奇(Larry Page)发明并以他自己的姓命名的一种网页重要程度算法。其核心是将每个网页视为都视为一个节点(node),而网页之间的链接则视为边(edge),由此构成了一个巨大无比的网络。PageRank算法关注的是如何给每个节点赋予相应的权重,来决定它们在搜索结果中的排序(或者说与关键词的相关度)。

PR计算公式:





其中PR(A) 表示页面A的PageRank值,L(x) 表示在特定页面上的外链接总数。d 是“阻尼系数”,它是一个常量,为0.85。N 是参与计算的所有网页数量。由于每个网页的PR值都依赖所有指向它的网页的PR值,所以PR值的计算是一个不断迭代的过程。在经过一定次数的迭代之后,PR值会趋向一个稳定的值,这个值介于0~1之间,这就是最终参与搜索结果排名的PR值。



详细数学推导见:https://zh.wikipedia.org/wiki/PageRank

发布于: 2020 年 09 月 07 日 阅读数: 21
用户头像

吴炳华

关注

还未添加个人签名 2020.04.08 加入

还未添加个人简介

评论

发布
暂无评论
架构师训练营作业 -- Week 13