写点什么

第十三周 数据应(二)作业

用户头像
钟杰
关注
发布于: 2020 年 12 月 20 日

1.Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算 法)

投票


A 页面到 B 页面的链接解释为 A 页面给 B 页面投票

PR 值


A 页面 PR 值即为指向它的页面的 PR 值除该页面的链接总数就是为 A 的 PR 值

PR(A)=PR(X)/Count,其中 PR(X)该页面的 PR 值,Count 为该页面的总链接数

随机跳出


页面随机跳转到另外一个页面的概率值,为了解决页面指向自身的问题,于是公式就变成了

PR(A)=p(PR(X)/Count)+(1-p)/N,其中 p 为 X 页面跳转到 A 页面的概率值,N 为总的页面数字

特征向量


把所有页面的值作为一个特殊矩阵中的特征向量

向量迭代运算


将特殊矩阵带入初始值进行迭代运算,当 PR 值趋向稳定后即完成了计算

用户头像

钟杰

关注

还未添加个人签名 2019.02.12 加入

还未添加个人简介

评论

发布
暂无评论
第十三周 数据应(二)作业