第十三周作业 (作业一)
作业:Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
对于一个页面 A,那么它的 PR 值为:
PR(A) 是页面 A 的 PR 值
PR(Ti)是页面 Ti 的 PR 值,在这里,页面 Ti 是指向 A 的所有页面中的某个页面
C(Ti)是页面 Ti 的出度,也就是 Ti 指向其他页面的边的个数
d 为阻尼系数,其意义是,在任意时刻,用户到达某页面后并继续向后浏览的概率,该数值是根据上网者使用浏览器书签的平均频率估算而得,通常 d=0.85
还有一个版本的公式:
N 为页面的总数
总结:求某个页面的 PageRank,该页面标记为 A
1、(1-d)/N 记为 B
2、每个指向求 PageRank 值的页面,这些页面各自求自己的 PageRank(初始为 1)除以页面的出度,然后将各自算的值加起来求和然后乘以 d,得到的值记为 C
那么 A 页面的 PageRank 为 B+C,然后把得到的 PageRank 再代入到公式中进行迭代就算,直到误差小于一定的值为止,最终确定一个 PageRank 值。
版权声明: 本文为 InfoQ 作者【Geek_83908e】的原创文章。
原文链接:【http://xie.infoq.cn/article/ce6e73f6dd937e68d97112d5d】。文章转载请联系作者。
评论