第 13 周作业
一、你所在的行业,常用的数据分析指标有哪些?请简述。
我的公司所在行业目前用数据分析还比较少,我们公司的业务就更少了。
不过有些业务也会使用新增用户数、活跃用户数、GMV、转化率等。
以后可以考虑在公司业务中融合更多等数据分析功能,完善客户的使用体验。
二、Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
核心思想
如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是 PageRank 值会相对较高
如果一个 PageRank 值很高的网页链接到一个其他的网页,那么被链接到的网页的 PageRank 值会相应地因此而提高。
算法简述
PageRank 算法总的来说就是预先给每个网页一个 PR 值(下面用 PR 值指代 PageRank 值),由于 PR 值物理意义上为一个网页被访问概率,所以一般是 1𝑁,其中 N 为网页总数。另外,一般情况下,所有网页的 PR 值的总和为 1。如果不为 1 的话也不是不行,最后算出来的不同网页之间 PR 值的大小关系仍然是正确的,只是不能直接地反映概率了。
预先给定 PR 值后,通过下面的算法不断迭代,直至达到平稳分布为止。
版权声明: 本文为 InfoQ 作者【hunk】的原创文章。
原文链接:【http://xie.infoq.cn/article/020810016871ea3bd5a1954f0】。未经作者许可,禁止转载。
评论