写点什么

第十三周作业 (作业一)

用户头像
Geek_83908e
关注
发布于: 2020 年 12 月 19 日

作业:Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)

对于一个页面 A,那么它的 PR 值为:



  • PR(A) 是页面 A 的 PR 值

  • PR(Ti)是页面 Ti 的 PR 值,在这里,页面 Ti 是指向 A 的所有页面中的某个页面

  • C(Ti)是页面 Ti 的出度,也就是 Ti 指向其他页面的边的个数

  • d 为阻尼系数,其意义是,在任意时刻,用户到达某页面后并继续向后浏览的概率,该数值是根据上网者使用浏览器书签的平均频率估算而得,通常 d=0.85

还有一个版本的公式:



N 为页面的总数


总结:求某个页面的 PageRank,该页面标记为 A

1、(1-d)/N 记为 B

2、每个指向求 PageRank 值的页面,这些页面各自求自己的 PageRank(初始为 1)除以页面的出度,然后将各自算的值加起来求和然后乘以 d,得到的值记为 C

那么 A 页面的 PageRank 为 B+C,然后把得到的 PageRank 再代入到公式中进行迭代就算,直到误差小于一定的值为止,最终确定一个 PageRank 值。

发布于: 2020 年 12 月 19 日阅读数: 114
用户头像

Geek_83908e

关注

还未添加个人签名 2019.04.28 加入

还未添加个人简介

评论

发布
暂无评论
第十三周作业 (作业一)