写点什么

对 PageRank 的理解

用户头像
2流程序员
关注
发布于: 2020 年 09 月 09 日

PageRank 将对页面的链接看成投票。


一个页面的“得票数”由所有链向它的页面的重要性来决定,到一个页面的超链接相当于对该页投一票。一个页面的 PageRank 是由所有链向它的页面的重要性经过递归算法得到的。一个有较多链向的页面会有较高的等级,相反如果一个页面没有任何链向页面,那么它没有等级。


假设一个由 4 个页面组成的小团体:A,B,C 和 D。如果所有页面都链向 A,那么 A 的 PR(PageRank)值将是 B,C 及 D 的 Pagerank 总和。



继续假设 B 也有链接到 C,并且 D 也有链接到包括 A 的 3 个页面。一个页面不能投票 2 次。所以 B 给每个页面半票。以同样的逻辑,D 投出的票只有三分之一算到了 A 的 PageRank 上。



换句话说,根据链出总数平分一个页面的 PR 值。



最后,所有这些被换算为一个百分比再乘上一个系数。由于“没有向外链接的页面”传递出去的 PageRank 会是 0,所以,Google 通过数学系统给了每个页面一个最小值:



Google 不断的重复计算每个页面的 PageRank。如果给每个页面一个随机 PageRank 值(非 0),那么经过不断的重复计算,这些页面的 PR 值会趋向于稳定,也就是收敛的状态。的


用户头像

2流程序员

关注

还未添加个人签名 2020.03.18 加入

还未添加个人简介

评论

发布
暂无评论
对PageRank的理解