第 13 周作业
你所在的行业,常用的数据分析指标有哪些?请简述。
以手游为例,简述部分指标:
新增用户数,统计周期内新增的用户数量,日新增、周新增、月新增。在产品上线后需要持续关注,是否有异常情况。运营活动、版本更新等前后的数据需要对比分析。
新增设备数,与新增用户数稍有区别,一个设备上可能有多个账号,比如一个游客账号,一个 FB 账号。
留存率,一般为次日留存率、3 日留存率、7 日留存率、15 日留存率、30 日留存率,有时需要看每天的留存,因为产品的衰减模型一定是符合幂减函数模型的,所以可以根据 1~7、14、30 日留存估算出其它日期的留存。
日活、月活,打开产品的用户数量,每天或每月为周期。
日流水、月流水,每日总的充值金额,每月总的充值金额。
APRU、ARPPU,每活跃用户充值金额,每充值用户充值金额。
LTV,用户生命周期价值。
Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
PageRank 算法以 Google 公司创办人拉里·佩奇(Larry Page)之姓来命名。
PageRank 算法使用超链接关系来确定一个页面的等级,计算投票数量,比如 A 页面有链接到 B 页面,即被认为是 A 页面给 B 页面投票。得票数越高则排名越靠前。
到一个页面的每一个超链接相当于对该页面投了一票,一个页面如果有较多链入的页面,就会有较高的等级,如果一个都没有,则没有等级。
全世界有万亿级别的网页,计算每个页面的票数需要递归算法处理。
假设一个由 4 个页面组成的小团体:A,B,C 和 D。如果所有页面都链向 A,那么 A 的 PageRank 值将是 B,C 及 D 的 Pagerank 总和。
如果一个页面链出到 2 个页面,因为一个页面不能投票 2 次,所以这个页面给这 2 个页面各半票。
互联网中一个网页如果对自己出链,或者几网页的出链形成一个循环圈,那么这一个或几个网页的 PageRank 值将是不合理的。
如上提到的,全世界有万亿级别的网页,因此需要应用大数据工具,并以下面的公式来计算。
评论