「架构师训练营」作业:第 13 周
Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
PageRank
算法以前就是Google
的网页排序算法。是一种由搜索引擎根据网页之间相互的超链接计算的技术。
排名原理:让链接来【投票】
PageRank
通过网络浩瀚的超链接关系来确定一个页面的等级。每个页面都算一个Rank
值,Rank
值越高,就越应该排在前面。PageRank
认为A
页面有指向B
页面的链接,那么就认为A
给B
投了一票,B
页面是更有价值的页面。如果一个页面得到这样的投票越多,那么它的等级越高。
PageRank
算法
B
、C
、D
页面都指向A
页面,那么A
页面的PR
值是 3 个页面的加权PR
值的总和。
如果一个页面不指向别人,只指向自己。并且其他的页面都指向它。那么它的PR
值就会变成最大了。这显然是不合理的。
针对这种情况,PR
值的计算公式加入了一个跳转到一个随机网页的概率。
评论