架构师训练营 - 第十三周
作业一:
Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)
PageRank 算法
主要原理及思想:通过网络页面之间的超链接关系确定页面的重要等级。
算法依据:B 页面到 A 页面的链接,解释为 A 页面对 B 页面的投票,Google 根据投票来源与投票目标确定页面的等级。
算法公式:
表达式:
矩阵表示:
作业二:
根据当周学习情况,完成一篇学习总结
Spark
特点:
DAG 切分的多阶段计算过程更快速
使用内存存储结算结果更高效
RDD 的编程模型更简单
流计算:实时计算系统
低延迟
高性能
分布式
可伸缩
高可用
大数据可视化
数据大屏
互联网运营常用数据指标
新增用户数
用户留存率
活跃用户数
PV
GMV
转化率
大数据与机器学习算法
PageRank 算法
KNN 分类算法
数据的距离算法
提取文本的特征值 TF-IDF 算法
贝叶斯分类算法
K-means 聚类算法
推荐引擎算法
基于人口统计的推荐
基于商品属性的推荐
基于用户的协同过滤推荐
基于商品的协同过滤推荐
评论