写点什么

架构师训练营第 1 期第 13 周作业

用户头像
好吃不贵
关注
发布于: 2020 年 12 月 17 日
架构师训练营第 1 期第 13 周作业

你所在的行业,常用的数据分析指标有哪些?请简述。

Throughput吞吐量,表示的含义是单位时间能够发送的Bytes数。

Latency延迟,表示的含义是从发送开始,到接收之后,需要多少时间。

Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)

首先访问一个比较知名度网页版Page,然后查询该网页上,有多少超链接,分别访问这些超链接。根据DAG图,得出每个网页的Rank分值。在计算分值的时候,会根据源网页有几个指向,除以这个数之后,再得出具体值。如果一个页面被其他更多页面引用了,说明这个页面很重要。要排除指向自己的超链接,否则会导致这个作弊网页的分值越来越高。

可以通过稀疏矩阵的方式来加快计算速度。如果这个坐标为1,那么表示有超链接,如果为0,表示没有超链接。



用户头像

好吃不贵

关注

还未添加个人签名 2018.11.20 加入

还未添加个人简介

评论

发布
暂无评论
架构师训练营第 1 期第 13 周作业