第 13 周 系统架构作业
1、你所在的行业,常用的数据分析指标有哪些?请简述。
我所在的行业为业务安全行业,指标有很多,不能一一说明,只能展示部分,例如:
a.特定时间段内主体关联客体取值连续相同次数统计
b.特定时间段内主体关联客体取值连续逐笔递减判断
c.一段时间内主体操作状态连续相同次数统计
d.一段时间内主体关联客体取值连续相同次数统计
e.几天内每日操作次数超过阈值的连续操作天数统计
f.时间段内主体操作状态连续相同次数统计
g.几天内每日操作次数超过阈值的最大连续操作天数统计
2、Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
PageRank 是一个利用网页链接之间的关系来投票,最终每一个页面会根据这个投票会得到一个分值,Google 搜索的时候会将这些页面按照分值的高低进行倒排序显示的算法。
具体的算法为,把从 A 页面到 B 页面的链接解释为 A 页面给 B 页面投票,一个页面的 PageRank 是由所有链向它的页面的重要性经过递归算法得到的。一个有较多链入的页面会有较高的等级。但考虑到实际计算过程中会出现页面指向自己和几个网页的出链形成一个循环圈,在断地迭代过程中,这一个或几个网页的 PR 值将只增不减的情况,PageRank 计算公式最终为:
评论