写点什么

Week_13 作业

用户头像
golangboy
关注
发布于: 2020 年 12 月 20 日

Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)

原理

  • 简述:页面 a 有指向页面 b 的链接,则表示 a 给 b 投票。依据 b 的投票数和投票页面 a 的 pagerank 值决定 b 的 pagerank,经过多次迭代计算后,投票数趋于稳定,以此来决定排名顺序

  • 公式


分子是当前页面的 pagerank 值,分母是当前页面总的链接数。各页面 pagerank 值除以各页面总链接数之和,等于指向的目标页面的 pagerank 值。

  • 问题

页面中如果只有自己对自己链接,通过上述迭代计算,会导致该页面 pagerank 不断增大,因此算法需要进行改进

  • 改进

引入概率系数,减弱自链接对 rangpage 的影响,增加其他页面跳转到该页面的概率


每一个页面都要进行 pagerank 的计算,所有的页面的 pagerank 构成了一个代数中的特征向量。大数据系统通过计算该向量矩阵,得到最终的 pagerank 向量,最后经过排序,获取到页面排名表


用户头像

golangboy

关注

还未添加个人签名 2018.09.18 加入

还未添加个人简介

评论

发布
暂无评论
Week_13 作业