架构师训练营 1 期 - 第 十三周作业(vaik)
作业
你所在的行业,常用的数据分析指标有哪些?请简述。
教育行业数据分析指标一般有:
学校数
教师数
学生数
家长数
PV页面访问量
DAU日活用户
MAU月活用户
人均日活时长
人均使用频次(次/天)
GMV成交总金额
转化率
Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
一个网页的PageRank值是由其它链接到这个网页的页面的PageRank值决定的,可简单理解
假设网页p1有三个页面p2,p3,p4链接它,可表示:
PR(p1) = PR(p2)+PR(p3)+PR(p4)
如果网页p2有2个外链,p3有一个外链,p4有一个外链, PR(p1)的值被分散了,可表示为:
PR(p1) = PR(p2)/2+PR(p3)/1+PR(p4)/3
我们用L表示页面的外链数,则表示为:
PR(p1)= PR(p2)/L(p2)+PR(p3)/L(p3)+PR(p4)/L(p4)
由于,存在几个网页相互链接的小循环,还有一种只对自己的出链,在不断地迭代过程计算下,这一个或几个网页的PR值将只增不减,这明显不合理,为了解决这个问题我们想象一个随机浏览网页的人,假定他有一个确定的概率会输入网址直接跳转到一个随机的网页,并且跳转到每个网页的概率是一样的。于是则此图中A的PR值可表示为:
PR(p1) = a(PR(p2)/2)+(1-a)/4
基于以上设定,PageRank的计算分式可表示如下:
评论