架构师训练营第 1 期第 13 周作业
你所在的行业,常用的数据分析指标有哪些?请简述。
Throughput吞吐量,表示的含义是单位时间能够发送的Bytes数。
Latency延迟,表示的含义是从发送开始,到接收之后,需要多少时间。
Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
首先访问一个比较知名度网页版Page,然后查询该网页上,有多少超链接,分别访问这些超链接。根据DAG图,得出每个网页的Rank分值。在计算分值的时候,会根据源网页有几个指向,除以这个数之后,再得出具体值。如果一个页面被其他更多页面引用了,说明这个页面很重要。要排除指向自己的超链接,否则会导致这个作弊网页的分值越来越高。
可以通过稀疏矩阵的方式来加快计算速度。如果这个坐标为1,那么表示有超链接,如果为0,表示没有超链接。
评论