week13 作业
作业 1
Google 搜索引擎是如何对搜索结果进行排序的?
谷歌的两位创始人,当时还是美国斯坦福大学 (Stanford University) 研究生的佩奇 (Larry Page) 和布林 (Sergey Brin) 开始了对网页排序问题的研究。他们的借鉴了学术界评判学术论文重要性的通用方法, 那就是看论文的引用次数。由此想到网页的重要性也可以根据这种方法来评价。于是 PageRank 的核心思想就诞生了:
如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是 PageRank 值会相对较高
如果一个 PageRank 值很高的网页链接到一个其他的网页,那么被链接到的网页的 PageRank 值会相应地因此而提高
算法原理
主要分两步
给每个网页一个 PR 值(下面用 PR 值指代 PageRank 值)
通过(投票)算法不断迭代,直至达到平稳分布为止。
互联网中的众多网页可以看作一个有向图。下图是一个简单的例子
由于 PR 值物理意义上为一个网页被访问概率
A、B、C 三个页面都链入 D 页面,则 D 的 PR 值将是 A、B、C 三个页面 PR 值的总和:
PR(A)=PR(B)+PR(C)+PR(D)
继续上面的假设,A 除了链接到 D 以外,A 还链接了 C 和 B,那么当用户访问 A 的时候,就有跳转到 B、C 或者 D 的可能性,跳转概率均为 1/3。在计算 D 的 PR 值时,A 的 PR 值只能投出 1/ 3 的票,B 的 PR 值只能投出
1 /2的票,而 C 只链接到 D,所以能投出全票,所以 D 的 PR 值总和应为:
P R ( D ) = P R ( A ) / 3 + P R ( B ) / 2 + P R ( C )
所以可以得出一个网页的 PR 值计算公式应为:
其中,B u是所有链接到网页 u 的网页集合,网页 v 是属于集合 B u 的一个网页,L(v)则是网页 v 的对外链接数(即出度)
经过 N 次迭代,PR 值逐渐收敛稳定。
作业 2
你所在的行业,常用的数据分析指标有哪些?请简述。
互联网运营常见指标有
新增用户数
新增用户数是网站增长性的关键指标,指新增加的访问网站的用户数(或者新下载 App 的用户数),对于一个处于爆发期的网站,新增用户数在短期内出现倍增的走势,是网站的战略机遇期,很多大型网站都经历过一个甚至多个短期内用户暴增的阶段。新增用户数有日新增用户数、周新增用户数、月新增用户等几种统计口径。
用户留存率
新增的用户并一定总是对网站(App)满意,在使用网站(App)后感到不满意,可能会注销账号(卸载 App),这些辛苦获取来的用户就流失掉了。网站把经过一段时间依然没有流失的用户称作留存用户,留存用户数比当期新增用户数就是用户留存率。
用户留存率 = 留存用户数 / 当期新增用户数
用户留存有时间窗口,即和当期数据比,3 天前新增用户留存的,称作 3 日留存;相应的,还有 5 日 留存、7 日留存等。新增用户通过可以通过广告、促销、病毒营销等手段获取,但是要让用户留下来,就必须要使产品有实打实的价值。用户留存率是反映用户体验和产品价值的一个重要指标,一般说来,3 日留存率能做到 40% 以上就算不错了。和用户留存率对应的是用户流失率。
活跃用户数
用户下载注册,但是很少打开产品,表示产品缺乏粘性和吸引力。活跃用户数表示打开使用产品的用户数,根据统计口径不同,有日活跃用户数、月活跃用户数等。提升活跃是网站运营的重要目标,各类 App 常用推送优惠促销消息给用户的手段促使用户打开产品。
PV
打开产品就算活跃,打开以后是否频繁操作,就用 PV 这个指标衡量,用户每次点击,每个页面跳转,被称为一个 PV(Page View)。PV 是网页访问统计的重要指标,在移动 App 上,需要进行一些变通来进行统计。
GMV
GMV 即成交总金额( Gross Merchandise Volume),是电商网站统计营业额(流水)、反映网站营收能力的重要指标。和 GMV 配合使用的还有订单量(用户下单总量)、客单价(单个订单的平均价格)等。
转化率
转化率是指在电商网站产生购买行为的用户与访问用户之比。
评论