写点什么

Week13

用户头像
一叶知秋
关注
发布于: 2020 年 09 月 09 日
  • 你所在的行业,常用的数据分析指标有哪些?请简述。

1、用户获取,用户接触、用户认知、用户兴趣、用户行动

2、渠道到达量,产品推广页有多少用户浏览

3、渠道转化率,与成本结合,衍生出CPM\CPC\CPA

4、渠道ROI,即投资回报比,通过利润/投资量化目标

5、日下载量,日新增用户数

6、用户活跃,日活跃/月活跃

7、用户留存

8、退出率

9、活跃交易用户数

10、用户分享率



  • Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)

1、搜索引擎解决三个问题:

建立资料库、索引(建立数据结构,能通过keyword找到文档),排序(对检索到的文档进行排序)

2、PageRank算法

将网页抽象为图中的一个节点,网页之间的链接关系表示一条有向边,整个web被抽象为一个有向图。

  • 图中 A 有 2 个入链,3 个出链。

  • 一个网页的影响力 = 所有入链集合的页面的加权影响力之和。

  • 出链会给被链接的页面赋予影响力,当我们统计了一个网页链出去的数量,也就是统计了这个网页的跳转概率。

  • A 有三个出链分别链接到了 B、C、D 上。那么当用户访问 A 的时候,就有跳转到 B、C 或者 D 的可能性,跳转概率均为 1/3。

  • B 有两个出链,链接到了 A 和 D 上,跳转概率为 1/2。

  • 我们可以得到 A、B、C、D 这四个网页的转移矩阵 M

  • 假设 A、B、C、D 四个页面的初始影响力都是相同的

  • 当进行第一次转移之后,各页面的影响力 w1​ 变为



  • 然后我们再用转移矩阵乘以 w1​ 得到 w2​ 结果,直到第 n 次迭代后 wn​ 影响力不再发生变化,可以收敛到 (0.3333,0.2222,0.2222,0.2222),也就是对应着 A、B、C、D 四个页面最终平衡状态下的影响力。

  • 你能看出 A 页面相比于其他页面来说权重更大,也就是 PR 值更高。而 B、C、D 页面的 PR 值相等。



用户头像

一叶知秋

关注

还未添加个人签名 2018.05.13 加入

还未添加个人简介

评论 (1 条评论)

发布
用户头像
作业请加“极客大学架构师训练营”标签,便于分类
2020 年 09 月 10 日 11:37
回复
没有更多了
Week13