架构师训练营 - 第十三周 - 作业一
作业一
题目一
你所在的行业,常用的数据分析指标有哪些?请简述。
所在行业,k12 教育行业。
常用的数据分析指标有
新增用户数
新增用户对于公司来说如同新鲜血液,非常重要,是公司发展的关键指标;一般会用到同比新增、环比新增、周新增、月新增等不同的口径。
用户留存率
用户长时间使用公司产品才能产生价值,所以留存是保证用户价值的核心;一般会用到 3 日留存、7 日留存等指标。
活跃用户数
代表打开公司产品的用户数,打开越频繁,代表粘性越大。一般会有日活跃用户数、月活跃用户数。
GMV
成交总金额,是反映公司营收能力的重要指标。
完课率
对于 k12 在线教育,保证完课率才能保证用户学习效果。
续报率
对于 k12 在线教育,用户续报率反映了用户对产品满意度,且显著影响公司效益。
转化率
有购买行为的用户数/总访问用户数
题目二
Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
通过页面链接来决定页面排序。
假设有页面 1、2、3,2、3 指向 1,那么 1 的 PR(1)=PR(2)+PR(3),更进一步因为每个页面只能投一次,那么 PR(1)=PR(2)/页面 2 总链接数+PR(3)/页面 3 总链接数。
由此引发另一个问题,如果页面之间形成环那么会导致 PR 值只增不减。
所以添加 a 来表示随机跳转的概率,PR(1)=a(PR(2)/页面 2 总链接数)+(1-a)/3+a(PR(3)/页面 3 总链接数)+(1-a)/3。
基于此,通过特征向量计算出每个页面的排序,以便搜索。
评论