写点什么

架构师训练营 1 期 - 第 十三周作业(vaik)

用户头像
行之
关注
发布于: 2020 年 12 月 20 日
架构师训练营 1 期 - 第 十三周作业(vaik)

作业

  1. 你所在的行业,常用的数据分析指标有哪些?请简述。

教育行业数据分析指标一般有:

学校数

教师数

学生数

家长数

PV页面访问量

DAU日活用户

MAU月活用户

人均日活时长

人均使用频次(次/天)

GMV成交总金额

转化率



  1. Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)

  • 一个网页的PageRank值是由其它链接到这个网页的页面的PageRank值决定的,可简单理解

假设网页p1有三个页面p2,p3,p4链接它,可表示:

PR(p1) = PR(p2)+PR(p3)+PR(p4)

  • 如果网页p2有2个外链,p3有一个外链,p4有一个外链, PR(p1)的值被分散了,可表示为:

PR(p1) = PR(p2)/2+PR(p3)/1+PR(p4)/3

  • 我们用L表示页面的外链数,则表示为:

PR(p1)= PR(p2)/L(p2)+PR(p3)/L(p3)+PR(p4)/L(p4)

  • 由于,存在几个网页相互链接的小循环,还有一种只对自己的出链,在不断地迭代过程计算下,这一个或几个网页的PR值将只增不减,这明显不合理,为了解决这个问题我们想象一个随机浏览网页的人,假定他有一个确定的概率会输入网址直接跳转到一个随机的网页,并且跳转到每个网页的概率是一样的。于是则此图中A的PR值可表示为:

PR(p1) = a(PR(p2)/2)+(1-a)/4

基于以上设定,PageRank的计算分式可表示如下:



用户头像

行之

关注

还未添加个人签名 2018.09.18 加入

还未添加个人简介

评论

发布
暂无评论
架构师训练营 1 期 - 第 十三周作业(vaik)