写点什么

数据分析作业

用户头像
Lane
关注
发布于: 2020 年 09 月 09 日

作业一:你所在的行业,常用的数据分析指标有哪些?请简述。



答:所在的行业是互联网医疗。我们主要的对外产品是和医院合作,同时2c病人使用的App。

我们通常关注的数据分析指标包括:

新增用户数儿

    它是网站增长性的关键指标,指新增加的访问网站的用户数(或者新下载App的用户数),对于一个处于爆发期的网站,新增用户数载短期内出现倍增的走势,是网站的战略机遇期,很多大型网站经历过一个甚至多个短期内用户暴增的阶段。新增用户数有日新增用户数,周新增用户数,月新增用户数等几种统计口径。



用户留存率

   新增的用户并不一定总是对网站(App)满意,在使用网站(App)后感到不满意,可能会注销账户(卸载App),这些辛苦获取来的用户就流失掉了。网站

   把经过一段时间依然没有流失的用户称作留存用户,留存用户数比当期用户数就是用户留存率。





   计算留存有时间窗口,即和当期数据比,3天前新增用户留存的,称作3日留存;相应的,还有5日留存,7日留存等。新增用户可以通过广告,促销,病毒营销

   等手段获取,但是要让用户留下来,就必须要使产品有实打实的价值。用户留存率是反映用户体验和产品价值的一个重要指标,一般说来,3日留存率能做到

   40%以上就算不错了,和用户留存率对应的是用户流失率





活跃用户数

   用户下载注册,但是很少打开产品,表示产品缺乏粘性和吸引力,活跃用户数表示打开使用产品的用户数,根据统计口径不同,有日活跃用户数、月活跃用户数等。

   提升活跃是网站运营的重要目标,各类App常用推送优惠促销给用户的手段促使用户打开产品。 

转化率

   转化率是指付费用户与访问用户之比。

   转化率 = 有购买行为的用户数 / 总访问用户数

作业二:Google搜索殷勤是如何对搜索结果进行排序的?

答:PageRank其实是让链接来投票,最终实现网站的排名。它有如下计算条件:

1.页面中有可能有都是指向外部链接的页面,即只有外链,或者几个网页的出链形成一个循环圈

2.一个页面会有多个外部链接,同时其他外部链接也会指向它

为了解决这些问题,Google设计的这个算法可以描述为如下:

如上图的示意,我们想象一个随意浏览网页的人,假定他有一个确定的概率会输入网址直接跳转到一个随机的网页,并且跳转到每个网页的概率是一样的,于是此图中A的PR值可表示为:

这里的 a& 的意思是停留本页面的概率,Google采用的是0.85,4在这里表示的是总共4个页面。

1-0.85 = 0.15 也就是15%的可能性跳出去,那么跳转到哪里呢?跳转到任何一个页面都有可能,所以也就除以了总页面数4。其他页面也有0.15的概率跳出去,所以前面的表达式要乘以a&-0.85,也就是要把那0.15跳出去的可能性剔除了。



根据上面的描述,我们就得到了完整的PageRank计算公式如下:

PageRang(pi) 的意思是每个页面的PR值

N 是总页面的意思

d在这里就是上面说的0.85

后面的PageRank(pj)表示的是所有指向它的页面的PageRank值 / L(pj)每个页面自己的保护的链接数儿,再求和乘以a& = 0.85



用户头像

Lane

关注

还有梦想 2018.07.05 加入

还未添加个人简介

评论

发布
暂无评论
数据分析作业