写点什么

十三周作业

用户头像
落朽
关注
发布于: 2021 年 01 月 17 日

你所在的行业,常用的数据分析指标有哪些?请简述。

做物流园的有一些指标,看到一些管理指标

1、车辆登记数,外来车辆登记入园

2、卡车和货车七日入园数

3、人员访问登记数

4、白名单车辆数

5、车辆入园排名

Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)

PageRank,网页排名,又称佩奇排名。谷歌的两位创始人,佩奇 (Larry Page) 和布林 (Sergey Brin) 开始了对网页排序问题的研究。他们的借鉴了学术界评判学术论文重要性的通用方法, 那就是看论文的引用次数。由此想到网页的重要性也可以根据这种方法来评价。于是 PageRank 的核心思想就诞生了,非常简单:

1、如果网页被别的网页链接指向的多,那么这个网页的 pageRank 的值相对就高,相反如果指向的比较少,相对值就会变得少

2、由于不同网页 PageRank 值,指向其他网页,那么由于指向的网页的值有高低,那么被指向的网页对应的 PageRank 值也会变得高和低不同。

图形展示:

看到指向 A 的网页有 B,C,D,那么 A 的 PR 值就和 B,C,D 有关系。

所以:PR(A) = PR(B) + PR(C) + PR(D)

那么可以看到 B 投出去两票,C 投出去 1 票,D 投出去 3 票:

所以:PR(A) = PR(B) /2+ PR(C)/1 + PR(D)/3


注意没有出链情况:这个图中 A 没有指向 B,C,D 那么计算 B 的值,发现只有 D 指向了它,这时候 A 默认对所有的网页都指向,包括它自己,所以 B 的值:PR(B) = PR(D)/3+PR(A)/4


指向自己的情况:

这个图中 C 指向自己,如果按照这个算法,C 会一直增大,解决这个问题。才有随机思想。也就是这个 C 随机会指向 A/B/C/D,所以 A 的值计算

PR(A) = å(PR(B)/2)+(1-å)/4 其中å一般是 0.85


用户头像

落朽

关注

还未添加个人签名 2018.03.26 加入

还未添加个人简介

评论

发布
暂无评论
十三周作业