写点什么

【第十三周】课后作业

用户头像
云龙
关注
发布于: 2020 年 12 月 20 日

作业:Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)


解答:Google 搜索引擎使用 PageRank 算法来对搜索结果进行排序的。简单来说,PageRank 由搜索引擎根据网页之间相互的超链接计算作为依据来进行排序的一种算法。通常一个网页里会有跳转到其他网页的链接, 比如 A 网页里有 B 网页的链接,我们称之为 A 给 B 投票,网页的 PageRank 就是在所有给它投票页面的重要性经过递归算法得到的。多个页面的投票是一种累加的关系,而重要性体现在,A 页面有 N 个超链接,那么 B 只是其中 N 分之一,那么 B 只能获得 A 的 PageRank 的 N 分之一。所以页面由链接跳转获得 PageRank 值是所有可以跳转到这个页面的其他页面 PageRank 除以其他页面的链接数,然后做累加的结果

当然如果多个页面之间存在链接环,仅仅这样处理还是不行的。为了解决链接环的问题, 需要引入随机网页跳转的概念,也就是说这个浏览网页的人有一定的概率输入网址直接跳转到随机的一个页面,并且跳转到每个页面的概率是一样的。所以页面由随机跳转获得的 PageRank 是 1 除以所有页面数。

这样的话,我们就给链接跳转的概率设置为 a, 那么随机跳转的概率就是 1-a。最终一个页面的 PageRank 值就是 a 乘以链接跳转的 PageRank,加上 1-a 乘以随机跳转的 PageRank。

用户头像

云龙

关注

还未添加个人签名 2018.03.30 加入

还未添加个人简介

评论

发布
暂无评论
【第十三周】课后作业