总结
1.大数据可视化
互联网运营常用数据指标
①.新增用户数 ②.用户留存率 ③活跃用户数 ④pv ⑤ GMV ⑥转化率
2 网页排名算法 pagerank
PageRank 网页排名,是由搜索引擎根据网页之间的超链接计算的技术,是网页排名的要素之一
PageRank 算法通过网络浩瀚的超链接关系来确定一个页面的等级,Google 把从 A 页面到 B 页面的链接解释为 A 页面给 B 页面投票,根据投票来源和投票目标的等级来决定新的等级。简单说,一个高等级的页面可以使其他低等级页面的等级提升。
3.机器学习系统架构
机器学习的数学原理:
给定模型类型,也就是给定函数类型的情况下,如何寻找使结构风险最小的函数表达式。由于函数类型已经给定,实际上就是求函数的参数。各种有样本的机器学习算法基本上都是各种模型的假设空间上求解结构风险最小值的过程,理解了这一点也就理解了各种机器学习算法的推导过程。
机器学习要从假设空间寻找最优函数,而最优函数就是使样本数据的函数值和真实值距离最小的那个函数。给定函数模型,求最优函数就是求函数的参数值。给定不同参数,得到不同含少数值和真实值的距离,这个距离就是损失,损失函数是关于模型参数的函数,距离越小损失越小。最小损失值对应的函数参数就是最优函数。
数学上求极小值就是求一阶导数,计算每个参数的一阶导数为零的偏微分方程组,就可以算出最优函数参数值。这就是为什么机器学习要计算偏微分方程的原因。
感知机
感知机是一种比较简单的二分类模型,将输入特征分类为+1,-1 两类。
评论