架构师训练营第二期 Week 13 作业
你所在的行业,常用的数据分析指标有哪些?请简述。
我们是零食订阅行业,商业模式比较奇怪,在国内似乎没有人搞起来过,所以现在业务只在国外,我们关注的指标主要是订阅类的指标,主要有:
Churn Rate (取消用户数 / 用户数 * 100):我们希望用户能一直订阅下去,所以取消订阅的比例很重要,取消意味着下个月收入减少,是我们最关注的指标。
Customer Acquisition Cost (成本 / 用户数):相对于取消,我们也关注新用户,取得用户需要花钱推广,如果费用太高而用户无法长时间订阅,总体来说是亏本的,所以我们关注不同渠道获得新用户的成本,尽力找效果好的渠道。
Monthly Recurring Revenue(月重复收入):这没什么说的,因为是订阅,每个月收入是可以预估的,通常会和其他指标一起使用查看公司运行是否健康。
Gross Margin(费用 / 收入):费用相对于收入的比例,可以用来考量公司是否盈利,是否投入过大需要融资等。
Average Revenue Per User(收入 / 用户数):每个用户的平均收入,通常用来计算 CLV
Customer Lifetime Value(ARPU / Churn Rate):用来预测平均一个用户从注册到取消能创造的价值,也是非常重要的,我们可以控制在一个用户上投入的成本以保证盈利,也可以预测相当长时间内公司的业务规模为发展做出规划。
Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
Google 是根据页面的链接关系对结果进行排序的,如果页面 A 含有页面 B 的链接,就视为页面 A 给页面 B 投了一票,页面 B 的评分就会增加。一个页面的得分和所有指向这个页面的链接综合得出。
首先 Google 会统计每个页面的链接关系,一个页面只有一次投票的机会,如果这个页面含有多个链接,则每个链接平分这次投票的分数。
算法同时假设用户每次访问一个页面时,都有一定几率会继续点击链接,同时也会停止点击输入 URL 跳到一个随机页面,且所有页面继续点击的几率是一样的。如果一个页面没有往外的链接,我们就假设用户会从这个页面去到所有页面中的任何一个。我们把继续点击的几率叫 Damping Factor,一般设为 0.85 左右。
在这个基础上,我们优化公式,把它变成一个矩阵计算,并迭代直到收敛得到最终的评分。
我感觉纯粹凭文字很难说清楚,图解和公式请看PageRank - Wikipedia 比较清楚。
评论