写点什么

十三周 - 作业

用户头像
水浴清风
关注
发布于: 2021 年 01 月 17 日

Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)

1、用户在搜索引擎里输入搜索内容,搜索引擎对搜索内容进行分词处理,得到搜索分词

2、把搜索分词通过倒排索引获取文档集合

3、通过 pageRank 算法对文档集合的每一个文档计算 PR,参考 PR 值进行排序。

pageRank 是在拓扑图中通过每一个节点页面的入度(其他页面指向当前页面的链接数,被链接即认为被投票)和出度(当前页面指向其他页面)来评估每个页面的重要程度的,即被其他页面链接的越多的页面越重要。

例如:下图的每个页面的 PR(A) = (1-D)+ D( 1/3 * PR(D)+ PR(C)+ 1/2 *PR(B))

D 是从 A 页面随机跳出概率


用户头像

水浴清风

关注

还未添加个人签名 2018.05.16 加入

还未添加个人简介

评论

发布
暂无评论
十三周-作业