写点什么

架构师训练营第 13 周课后练习

用户头像
菜青虫
关注
发布于: 2021 年 01 月 17 日
  • Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)


PageRank 值表示每个网页的质量,其核心思想有两条:

  1. 如果一个网页有越多的链接指向它,说明这个网页质量越高,PageRank 值越高,排名应该越靠前;

  2. 排名靠前的网页应该有更大的表决权,当一个网页被排名靠前的网页链接时,PageRank 值也越高,排名也更靠前。


PageRank 算法是一个迭代的过程:

  • 最开始的时候,假设搜索的网页具有相同的 PageRank 值

  • 根据初始值,开始第一轮的计算,按照链接数量和每个网页的 PageRank 值重新计算每一个网页的 PageRank 值

  • 重复计算下去,直至每个网页的 PageRank 值基本稳定


每一步更新 PageRank 值的公式如下:


表示页面, 是链入页面的集合, 链出页面的数量,是所有页面数量,是阻尼系数,表示用户点击此网页上的链接继续浏览的概率。


用户头像

菜青虫

关注

还未添加个人签名 2017.11.20 加入

还未添加个人简介

评论

发布
暂无评论
架构师训练营第 13 周课后练习