架构师训练营作业 -- Week 13

Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
PageRank 是有拉里·佩奇(Larry Page)发明并以他自己的姓命名的一种网页重要程度算法。其核心是将每个网页视为都视为一个节点(node),而网页之间的链接则视为边(edge),由此构成了一个巨大无比的网络。PageRank算法关注的是如何给每个节点赋予相应的权重,来决定它们在搜索结果中的排序(或者说与关键词的相关度)。
PR计算公式:

其中PR(A) 表示页面A的PageRank值,L(x) 表示在特定页面上的外链接总数。d 是“阻尼系数”,它是一个常量,为0.85。N 是参与计算的所有网页数量。由于每个网页的PR值都依赖所有指向它的网页的PR值,所以PR值的计算是一个不断迭代的过程。在经过一定次数的迭代之后,PR值会趋向一个稳定的值,这个值介于0~1之间,这就是最终参与搜索结果排名的PR值。
版权声明: 本文为 InfoQ 作者【吴炳华】的原创文章。
原文链接:【http://xie.infoq.cn/article/38ef32739af7160faeabff9be】。文章转载请联系作者。
评论