写点什么

第 13 周作业

用户头像
Steven
关注
发布于: 2021 年 01 月 17 日

你所在的行业,常用的数据分析指标有哪些?请简述。

以手游为例,简述部分指标:

  • 新增用户数,统计周期内新增的用户数量,日新增、周新增、月新增。在产品上线后需要持续关注,是否有异常情况。运营活动、版本更新等前后的数据需要对比分析。

  • 新增设备数,与新增用户数稍有区别,一个设备上可能有多个账号,比如一个游客账号,一个 FB 账号。

  • 留存率,一般为次日留存率、3 日留存率、7 日留存率、15 日留存率、30 日留存率,有时需要看每天的留存,因为产品的衰减模型一定是符合幂减函数模型的,所以可以根据 1~7、14、30 日留存估算出其它日期的留存。

  • 日活、月活,打开产品的用户数量,每天或每月为周期。

  • 日流水、月流水,每日总的充值金额,每月总的充值金额。

  • APRU、ARPPU,每活跃用户充值金额,每充值用户充值金额。

  • LTV,用户生命周期价值。

Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)


PageRank 算法以 Google 公司创办人拉里·佩奇(Larry Page)之姓来命名。


PageRank 算法使用超链接关系来确定一个页面的等级,计算投票数量,比如 A 页面有链接到 B 页面,即被认为是 A 页面给 B 页面投票。得票数越高则排名越靠前。

到一个页面的每一个超链接相当于对该页面投了一票,一个页面如果有较多链入的页面,就会有较高的等级,如果一个都没有,则没有等级。

全世界有万亿级别的网页,计算每个页面的票数需要递归算法处理。


假设一个由 4 个页面组成的小团体:A,B,C 和 D。如果所有页面都链向 A,那么 A 的 PageRank 值将是 B,C 及 D 的 Pagerank 总和。


如果一个页面链出到 2 个页面,因为一个页面不能投票 2 次,所以这个页面给这 2 个页面各半票。


互联网中一个网页如果对自己出链,或者几网页的出链形成一个循环圈,那么这一个或几个网页的 PageRank 值将是不合理的。


如上提到的,全世界有万亿级别的网页,因此需要应用大数据工具,并以下面的公式来计算。


用户头像

Steven

关注

还未添加个人签名 2008.07.18 加入

还未添加个人简介

评论

发布
暂无评论
第 13 周作业