十三周 - 作业
Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
1、用户在搜索引擎里输入搜索内容,搜索引擎对搜索内容进行分词处理,得到搜索分词
2、把搜索分词通过倒排索引获取文档集合
3、通过 pageRank 算法对文档集合的每一个文档计算 PR,参考 PR 值进行排序。
pageRank 是在拓扑图中通过每一个节点页面的入度(其他页面指向当前页面的链接数,被链接即认为被投票)和出度(当前页面指向其他页面)来评估每个页面的重要程度的,即被其他页面链接的越多的页面越重要。
例如:下图的每个页面的 PR(A) = (1-D)+ D( 1/3 * PR(D)+ PR(C)+ 1/2 *PR(B))
D 是从 A 页面随机跳出概率
评论