写点什么

架构师训练营第十三周

用户头像
跨域刀
关注
发布于: 2020 年 09 月 09 日

Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)

答:谷歌通过网页排名算法 PageRank,对全世界页面进行排序。

首先,对每个页面算 PageRank 值。当一个页面 a 包含 b 页面的链接,说明 b 页面比 a 页面等级高。

-- 一般不能通过简单的 a 页面,c 页面指向 b 页面的链接数和作为指标,因为每个页面的重要性不一致,这样会不精确。


通过加权可以解决这个问题,也就是每个页面向外指向的页面数就是该页面的加权值,如 b 页面给 a 页面的加权是 1/2,剩下的 1/2 给了 c 页面。

-- 这样子的话,如果有个页面指向了自己,则会造成该页面的指标虚高,欺骗了加权。


假设一个人浏览页面的时候,会随机跳到另一个页面。通过计算得到该概率 d。然后根据下面公式,就可以计算出某页面的在其他页面中的重要性。最后根据所有页面的重要性进行排序。这样就实现了对全世界页面的排序。


用户头像

跨域刀

关注

还未添加个人签名 2020.03.18 加入

还未添加个人简介

评论

发布
暂无评论
架构师训练营第十三周