Vol.2 谷歌不只有搜索

发布于: 2020 年 05 月 28 日
Vol.2 谷歌不只有搜索

封面图片:https://burst.shopify.com/ocean

看见Google的图标,又是熟悉的四原色。很久以前我对谷歌的印象就是,它只是一家做搜索的公司。但是,在我更多的了解谷歌后,我改变了这一看法。


什么是拉动谷歌的“三驾马车”?

“旧马车”

2003年10月19—22日,Google在美国纽约召开的第19届ACM操作系统原理研讨会(Symposium on Operating Systems Principles,SOSP)上,发表了论文《Google文件系统》,系统地介绍了Google面向大规模数据密集型应用的、可伸缩的分布式文件系统——GFS。

GFS是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。

GFS是一个可扩展的大型数据密集型应用的分布式文件系统,该文件系统可在廉价的硬件上运行,并具有可靠的容错能力,该文件系统可为用户提供极高的计算性能,而同时具备最小的硬件投资和运营成本。

2004年12月5日,Google在美国旧金山召开的第6届操作系统设计与实现研讨会(Operating Systems Design and Implementation,OSDI)上,发表了论文《MapReduce:超大集群的简单数据处理》,向全世界介绍了MapReduce系统的编程模式、实现、技巧、性能和经验。

Mapreduce是针对分布式并行计算的一套编程模型。

基于MapReduce编写的程序是在成千上万的普通PC机上被并行分布式自动执行,它将所有服务器中的处理器有效地利用起来,计算保存在谷歌文件系统(GFS)中的海量数据,并得到想要的结果。

2006年11月6—8日,Google在美国西雅图召开的第7届操作系统设计与实现研讨会上,发表了论文《BigTable:结构化数据的分布式存储系统》,分析了设计用于处理海量数据的分布式结构化数据存储系统BigTable的工作原理。

就像文件系统需要数据库来存储结构化数据一样,GFS也需要Bigtable来存储结构化数据。

参考文献

[1] The Google File System; http://labs.google.com/papers/gfs-sosp2003.pdf

[2] MapReduce: Simplifed Data Processing on Large Clusters; http://labs.google.com/papers/mapreduce-osdi04.pdf

[3] Bigtable: A Distributed Storage System for Structured Data;http://labs.google.com/papers/bigtable-osdi06.pdf


“新马车”

Caffeine

在Google采用Caffeine之前,Google使用MapReduce和分布式文件系统(如GFS)来构建搜索索引(从已知的Web页面索引中)。

在2010年,Google搜索引擎发生了重大变革。Google将其搜索迁移到新的软件平台,他们称之为“Caffeine”。

Our new search index: Caffeine

Today, we're announcing the completion of a new web indexing system called Caffeine.

June 8, 2010

Dremel

Dremel是一种分析信息的方式,Dremel可跨越数千台服务器运行,允许“查询”大量的数据,如Web文档集合或数字图书馆,甚至是数以百万计的垃圾信息的数据描述。

Google基础设施负责人Urs Hölzle表示“使用Dremel就好比你拥有类似SQL的语言,并可以无需任何编程的情况下只需将请求输入命令行中就可以很容易的制定即席查询和重复查询”。

据Google提交的文件显示你可以在几秒的时间处理PB级的数据查询。

目前Hadoop已经提供了在庞大数据集上运行类似SQL的查询工具(如Hadoop生态圈中的项目Pig和Hive)。但其会有一些延迟,例如当部署任务时,可能需要几分钟的时间或者几小时的时间来执行任务,虽然可以得到查询结果,但相比于Pig和Hive,Dremel几乎是瞬时的。

Spanner

Spanner 是谷歌公司开发的一款全球级分布式关系数据库管理系统。


谷歌云

入局云计算是一个耗时间,耗资金的“麻烦事儿”,但弄好了就是个“摇钱树”。

谷歌云官网其实提供了很完善的解决方案。

cloud.google.com

cloud.google.com

现在以及未来一段时间,"AI, Big Data, Cloud Computing"也就是“ABC”依然会很潮。

DevFest 2019 - 小南国

上面这张图片是当时参加聚会的时候拍的,可以看出谷歌要在“云”上发力了。

除了谷歌的Google Cloud,还有亚马逊的AWS,微软的Azure,阿里云,腾讯云,华为云,它们也都是知名的云厂商


谷歌靠什么盈利?

在谷歌的核心业务中,85% 左右的营收来自于互联网广告业务。在 Google 最新发布的 2019 财年第一季度财报中显示,总营收为 363.39 亿美元。而广告业务营收为 307.2 亿美元,占到总营收的 84.5%。

除了广告业务之外,Google 的其他业务如谷歌云、硬件等只占到总营收的 15.0%。

谷歌有强大的广告系统,“方便”和“免费”奠定了谷歌的广告营收模式。

谷歌很神秘吗?

在 Google 被重组为 Alphabet 之后,Google 的非核心业务被剥离。

图片采集自网络,侵删。

发布于: 2020 年 05 月 28 日 阅读数: 7
用户头像

LanpengR

关注

勿在浮沙築高台 2020.02.02 加入

mail@lp7.xyz | 信息与通信工程

评论

发布
暂无评论
Vol.2 谷歌不只有搜索