十三周作业
你所在的行业,常用的数据分析指标有哪些?请简述。
做物流园的有一些指标,看到一些管理指标
1、车辆登记数,外来车辆登记入园
2、卡车和货车七日入园数
3、人员访问登记数
4、白名单车辆数
5、车辆入园排名
Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
PageRank,网页排名,又称佩奇排名。谷歌的两位创始人,佩奇 (Larry Page) 和布林 (Sergey Brin) 开始了对网页排序问题的研究。他们的借鉴了学术界评判学术论文重要性的通用方法, 那就是看论文的引用次数。由此想到网页的重要性也可以根据这种方法来评价。于是 PageRank 的核心思想就诞生了,非常简单:
1、如果网页被别的网页链接指向的多,那么这个网页的 pageRank 的值相对就高,相反如果指向的比较少,相对值就会变得少
2、由于不同网页 PageRank 值,指向其他网页,那么由于指向的网页的值有高低,那么被指向的网页对应的 PageRank 值也会变得高和低不同。
图形展示:
看到指向 A 的网页有 B,C,D,那么 A 的 PR 值就和 B,C,D 有关系。
所以:PR(A) = PR(B) + PR(C) + PR(D)
那么可以看到 B 投出去两票,C 投出去 1 票,D 投出去 3 票:
所以:PR(A) = PR(B) /2+ PR(C)/1 + PR(D)/3
注意没有出链情况:这个图中 A 没有指向 B,C,D 那么计算 B 的值,发现只有 D 指向了它,这时候 A 默认对所有的网页都指向,包括它自己,所以 B 的值:PR(B) = PR(D)/3+PR(A)/4
指向自己的情况:
这个图中 C 指向自己,如果按照这个算法,C 会一直增大,解决这个问题。才有随机思想。也就是这个 C 随机会指向 A/B/C/D,所以 A 的值计算
PR(A) = å(PR(B)/2)+(1-å)/4 其中å一般是 0.85
评论