写点什么

架构师训练营 - 第十三周

用户头像
石子头
关注
发布于: 2021 年 01 月 11 日

作业一:

  • Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)

PageRank 算法

  • 主要原理及思想:通过网络页面之间的超链接关系确定页面的重要等级。

  • 算法依据:B 页面到 A 页面的链接,解释为 A 页面对 B 页面的投票,Google 根据投票来源与投票目标确定页面的等级。

  • 算法公式:

  • 表达式:

  • 矩阵表示:




作业二:

  • 根据当周学习情况,完成一篇学习总结


  1. Spark

  • 特点:

  • DAG 切分的多阶段计算过程更快速

  • 使用内存存储结算结果更高效

  • RDD 的编程模型更简单

  1. 流计算:实时计算系统

  • 低延迟

  • 高性能

  • 分布式

  • 可伸缩

  • 高可用

  1. 大数据可视化

  • 数据大屏

  • 互联网运营常用数据指标

  • 新增用户数

  • 用户留存率

  • 活跃用户数

  • PV

  • GMV

  • 转化率

  1. 大数据与机器学习算法

  • PageRank 算法

  • KNN 分类算法

  • 数据的距离算法

  • 提取文本的特征值 TF-IDF 算法

  • 贝叶斯分类算法

  • K-means 聚类算法

  • 推荐引擎算法

  • 基于人口统计的推荐

  • 基于商品属性的推荐

  • 基于用户的协同过滤推荐

  • 基于商品的协同过滤推荐


用户头像

石子头

关注

还未添加个人签名 2018.03.16 加入

还未添加个人简介

评论

发布
暂无评论
架构师训练营 - 第十三周