第十三周 数据应(二)作业
1.Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算 法)
投票
A 页面到 B 页面的链接解释为 A 页面给 B 页面投票
PR 值
A 页面 PR 值即为指向它的页面的 PR 值除该页面的链接总数就是为 A 的 PR 值
PR(A)=PR(X)/Count,其中 PR(X)该页面的 PR 值,Count 为该页面的总链接数
随机跳出
页面随机跳转到另外一个页面的概率值,为了解决页面指向自身的问题,于是公式就变成了
PR(A)=p(PR(X)/Count)+(1-p)/N,其中 p 为 X 页面跳转到 A 页面的概率值,N 为总的页面数字
特征向量
把所有页面的值作为一个特殊矩阵中的特征向量
向量迭代运算
将特殊矩阵带入初始值进行迭代运算,当 PR 值趋向稳定后即完成了计算
评论