架构师训练营 -week13- 作业
1、你所在的行业,常用的数据分析指标有哪些?请简述。
行业:供应链管理
日订单量、新增客户量、日采购量、客户转化率、商品丰富度、库存流转率。
2、Google搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述PageRank算法)
PageRank算法做了两个基本假设:
数量假设:被更多的网页链接到的网页更重要。
质量假设:有更高权重的网页会传递更高的权重出去。
PageRank的公式简单模型:
PR为权重,L为出链数。在理想状态下,页面i的权重是所有链接到该页面的页面平均投票权重的总和。
在初始化阶段,设所有页面的权重都为1,根据以上公式进行迭代计算,更新各个页面的PR值,直到PR值收敛。
终止点:
终止点是指一个没有任何出链的网页。
在基础公式中,终止点会导致转移矩阵终止转移概率,最后迭代的结果是所有的网页PR值都是0。
因此当访问到终止点时,以等概率跳转到下一个网页。该概率为1/矩阵行数。
陷阱:
陷阱/黑洞指的是只有指向自身链接的网页,如图中C点。
根据基础公式多次迭代,会使得陷阱页面的PR值为1,而其他正常网页的概率为0。
为了解决这个问题,就有了随机浏览模型。
其中d为阻尼系数,N为所有页面的数量。
版权声明: 本文为 InfoQ 作者【晓-Michelle】的原创文章。
原文链接:【http://xie.infoq.cn/article/f401c57f734b0142c35876653】。未经作者许可,禁止转载。
评论