PageRank 简述
PageRank是由谷歌创始人发明的,用于描述网页的权重。因为PageRank的问世以及在搜索引擎上的应用,搜索引擎返回的结果更加精准、符合用户需求,从而实现了搜索引擎本身的价值,即长尾需求满足。
在PageRank问世之前,用户搜索一个query时,经常出现结果不准的情况。原因包括网页相关度不高、作恶等可能。为了解决这些问题,谷歌创始人们就考虑如何提高用户搜索的网页质量,他们的解决方案就是通过网页相关度来找出高质量的网页。其中一个角度就是如果一个网页被别的网页链接的次数越多,那么这个网页的质量就越高(有点类似于学术论文影响因子)。
当然,发展到今天,PageRank考虑的角度会越来越多,要解决的问题也越来越多。之前是考虑一个网页本身的贡献程度,现在还要考虑作恶情况、文本的相关程度等等,据说已经包含几百种考虑因素。
版权声明: 本文为 InfoQ 作者【朱月俊】的原创文章。
原文链接:【http://xie.infoq.cn/article/6895a22c1f998b4761abde9ae】。文章转载请联系作者。
评论