写点什么

PageRank 算法

用户头像
周冬辉
关注
发布于: 2020 年 09 月 09 日



  • Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)



  • PageRank算法介绍

PageRank,网页排名,又称网页级别,Google左侧排名或佩奇排名,是一种由搜索引擎根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一,以Google公司创始人拉里·佩奇(Larry Page )之姓来命名。

PageRank通过网络浩瀚的超链接关系来确定一个页面的等级。Google把从A页面到B页面的链接解释为A页面给B页面投票,Google根据投票来源(甚至来源的来源,即链接到A页面的页面)和投票目标的等级来决定新的等级。简单的说,一个高等级的页面可以使其他低等级页面的等级提升。一个页面的「得票数」由所有链向它的页面的重要性来决定,到一个页面的超链接相当于对该页投一票。一个页面的PageRank是由所有链向它的页面(「链入页面」)的重要性经过算法得到的。一个有较多链入的页面会有较高的等级,相反如果一个页面没有任何链入页面,那么它没有等级。



  • PageRank算法简单来说分为两步:

  1. 给每个网页一个PR值(下面用PR值指代PageRank值)

  2. 通过(投票)算法不断迭代,直至达到平稳分布为止。



  • 考虑解决终止点问题和陷阱问题

PageRank计算公式



  • PageRank算法迭代速度采用大数据解决其时效的问题

PageRank值是一个特殊矩阵中的特征向量。这个特征向量为







参考

https://www.cnblogs.com/fengfenggirl/p/pagerank-introduction.html



用户头像

周冬辉

关注

还未添加个人签名 2020.04.14 加入

还未添加个人简介

评论

发布
暂无评论
PageRank 算法