week12-1 总结
1. 大数据
通常情况下,一个产品的产生,迭代,都是根据用户的需求,产品经理的需求,最终开发出来和升级迭代的。但是大数据正好是反过来的,大数据是通过一些用户的行为去猜测用户可能喜欢什么,从而得到需求,主动创造需求,在进行开发迭代,比如某个产品、页面大部分用户都是年轻人,那就要去分析一下,为什么,年轻人这么喜欢,而年纪大的人不喜欢呢,能不能参考思路设计一些年纪大的人喜欢的东西,通过大数据分析,需求就来了。
2. 意义
将来主流的方向,值得发展和深入学习。对于普通研发人员而言,不懂这方面的东西,大概率会处于技术圈金字塔偏底层,并且突破不了这个层面,就是很难提升。必须掌握的基础知识。
3. 历史
2004年前后Google发表了三篇论文,也就是经常听到的大数据“三驾马车”,分别是分布式文件系统GFS,大数据分布式计算框架MapReduce和NoSQL数据库BigTable。
分布式文件系统:解决的问题是可以存储海量的数据,便于读取进行计算。把数据存起来不是目的,而是要拿出来计算。
分布式计算框架:解决计算速度问题,大规模服务器并行处理(几十万服务器),对海量的数据进行计算。
评论