Cloudera 的企业数据云
云上升明月,天涯共此时。
01 云上升明月
这几天翻朋友圈,看到了今年 7 月 Cloudera 与阿里云合作的新闻。
于是想起了两年前我发的一条短信:“云(Cloud)上升明月,天涯共此时(era)”。
短信是发给 Cloudera 伙伴的,当时是 2019 年中秋,我还在阿里云,正好在参与阿里云跟 Cloudera 的合作沟通。我是阿里这边的对接人,于是借改的这句中秋常用诗,表达了一下美好期待。
不过现实比想象的要难一些,后来我从阿里离职,就没再关注了,直到现在看到新闻。这样算来,整个合作基本花了两年时间。
两年,站在我的角度可能心有戚戚或耿耿于怀,但站在 Cloudera 的角度,以登陆阿里云为标志性节点,这就是他向云转型的两年。
2019 年 7 月,Cloudera 宣布了一项包括合并产品线、修改开源策略、全面拥抱云计算等三项主要内容的转型计划。
Cloudera 的名字其实特别有意思,拆开来看,一半是 Cloud,一半是 Era,合起来就是云时代……但略显讽刺的是,Cloudera 之前并没有重视云。所以曾经有句话是这样说的:“在 cloud 时代,Cloudera 没有 cloud,也没有 era……”。这是一句尖刻的话,但也反应了之前大家对 Cloudera 最大的诟病——产品私有化部署,没有未来。
私有化有没有未来不好说,但未来是什么,是趋势,而趋势大部分情况下就是大家的共识,本质上是主观的。
举个例子。
和 Cloudera 在同一个市场领域的还有家公司叫 Snowflake,两者的产品都是数据处理平台类产品。在 Forrester 2021 年 Q1 云数仓测评中,他俩在市场维度得分基本相当:Cloudera 3.4 Snowflake 3.6,营收、客户、等方面相同,差异只在市场知名度上。
按理来说,市场方向差不多,营收也差不多的两家公司,市值应该也不会有太大区别。但事实远非如此,Snowflake 市值 1000 亿美金,Cloudera 只有 50 亿美金,20 倍的差距。
乍一看似乎有点不可思议,但市值本来就是投资人的主观评价,投资人认为 Snowflake 的 SaaS 模式代表了未来,于是高估值做趋势投资,这种模式也并不罕见。
所以争论私有化有没有未来是徒劳的,顺应潮流才是最佳选择。
Cloudera 的转型就是如此。
从 2019 年开始,Cloudera 的产品陆续登陆 AWS、Azure,并在今年落地阿里云,基本覆盖了主要市场的主要云厂商。
说阿里云是标志性节点,不是因为我曾参与过而特别有感情,而是因为中国对云有着更为严格的管控。
大家可能不知道,Azure 在中国的运营主体不是微软,而是世纪互联,AWS 在中国的运营主体也不是亚马逊,而是光环新网和西云数据。这是因为在中国提供基础云服务需要 IDC 牌照,但这个牌照对外资来说是很难拿到的,所以他们只能找本地伙伴合作。Cloudera 跟云厂商的合作也不例外,在国外,它可以自己决定在某个云上提供服务,但国内就不行,必须通过某个伙伴来进行“本地化”。
所以在它和所有云厂商的合作中,阿里云是最麻烦的。
我记得当时一开始我们很快就弄清楚了产品技术层面的合作思路,但法律方面却一直定不下来,比如开票方、责任主体、仲裁地等,都需要反复讨论。虽然后来我不在阿里了,但就像 Azure 跟世纪互联的合作中,最终签掉几百页协议、一堆合同及不计其数的保密条款一样,我想 Cloudera 跟阿里云也经历了这个过程。
现在搞定阿里云,Cloudera 上云这张试卷就做完了最难的部分,是为标志性节点。
所谓云上升明月。
02 天涯共此时
任何合作都要满足双方利益。
先说阿里云。
前面提到过 Forrester 2021 Q1 的云数仓评测,这个测评除了市场表现外,也覆盖了产品力。根据 Forrester 的评测,Cloudera 的产品力基本介于阿里云和 Snowflake 之间。
这就是阿里云选择跟 Cloudera 合作的最初动机,后来经过总结,我认为合作后收益有三点:
第一,Cloudera 的产品是大数据处理领域的事实标准,把它放到阿里云上,有助于提升阿里云大数据整体竞争力。
第二,Cloudera 手里有很多阿里云想触达的客户,尤其是大客户,比如全球 10 大汽车制造商、10 大电信运营商、10 大医药制造商的 9 个,10 大银行中的 8 个,中国 3 大运营商,大部分银行、保险公司等等。合作后它们会继续用 Cloudera 的大数据产品,但底层却是阿里云的资源,相当于成为了阿里云的客户。
第三,防御。阿里云大数据在国内云厂商中还是比较领先的,是竞争中一项很重要的差异化优势,但如果其它云厂商先达成了跟 Cloudera 的合作,借助 Cloudera 的产品,可能就会削弱这一点。
这些代表着当时的我的个人观点,不过更有推动作用的是那年癫总正大搞阿里云生态,就在我们为了 KPI 而盘点有哪些公司可以搞搞且很快注意到 Cloudera 的时候,Cloudera 的伙伴也通过中间人找到了我们,然后大家一拍即合,所有人都达成了合作意向。
那 Cloudera 的动机呢?
我以为也有三点。
第一,扩大客户群体。
直接来看,它和阿里云的合作能产生一种“交叉引流”作用:它的客户固然会用阿里云的基础资源,但阿里云的某些客户也会开通自己的云产品,所以对 Cloudera 来说,这增加了对客户,尤其是长尾客户的覆盖度。
第二,产品更符合客户在政治和经济上的需求。
Cloudera 上云的产品叫 CDP,全称 Cloudera Data Platform,是一个企业数据云产品。
什么是企业数据云?
这要从需求开始说。
随着大数据、AI、云计算等各种技术的蓬勃发展,目前企业围绕着数据的需求有两个维度:
场景上,要覆盖数据集成、数据存储、数据处理、数据分析和 AI 等多种场景。
形态上,能够在多种公共云、私有云,以及私有云+公共云等多种组合下的部署,即混合云。
某些研究机构把这种能一站式满足这些需求的产品称为企业智能平台,Cloudera 则将其定义为企业数据云。
对应的产品就是 CDP。
CDP 在场景丰富度上一直是有优势的。如果仔细关注一下 Forrester 的测评的话,会发现 CDP 在数据分析能力、机器学习和数据科学等多场景方面都要比 Snowflake 好,而这仅仅是在对比数仓这个板块。如果再算上实时数据流、数据工程等领域的话,按照 Cloudera 伙伴的说法,市面上全能满足的,目前只有 CDP 一个。
所以 Cloudera 选择跟阿里云合作,其实就是为了满足形态上混合云的要求。
客户为什么要混合云呢?
混合云首先能够给客户带来经济上的收益。
研究机构 451Research 测算过,在资源利用率超过 70%的情况下,私有云的成本比公共云低。所以企业的最佳策略是混合部署:固定的工作负载放在私有云上,以达到较高资源利用率来降低成本,灵活的业务需求用公共云满足,保留敏捷扩展能力。
而一个统一的混合云平台能够在分别部署的基础上再节省 10%的成本。
其次,混合云还能满足某种政治诉求。
用过云服务都知道,云厂商会不断向你推荐他们独有的产品。只要你深度使用后,一般就很难迁走了,这俗称锁定(lock in)。一旦被锁定,虽然看上去双方还在自由贸易,但轻则形成技术依赖,重则会变成云厂商的殖民地,整天被技术倾销。
而混合云平台是独立于云厂商的,并只依赖不同云厂商提供的共性基础。所以显而易见,不管 A 云还是 C 云,不过是若干对等供应商中的一个,不仅技术供应链是安全的,而且还能带来更好的议价能力。
所以混合云更像一种政治经济学,尤其受大企业欢迎。
这点也和 Cloudera 目前的客户群体相吻合。
第三,增强交付能力。
先是时间上的快。
在传统的企业级 IT 项目中,大一点的都有一个漫长的采购和交付过程,包括售前方案、招投标、签合同、安装部署、试运行、初验、终验等诸多环节……来来回回总要几个月。但云改变了这个过程:一键试用、无缝扩容、按需付费,用不着做那么多售前评估,时间上要快的多。
然后是空间覆盖度。
通过多年积累,大型云厂商的数据中心基本已经覆盖到了全球,以阿里云为例,他在国内就有 12 个区域,在亚太还有 6 个,基本上可以满足大部分客户的大部分需求。所以跟云厂商合作后,Cloudera 也就有了这种覆盖力,就能把 CDP 部署到全球任意区域,大大增强了交付能力。
所谓天涯共此时。
03 明月
贝索斯说他常被人问到未来十年会有什么变化,但他认为人们应该关注的不是未来有什么变化,而是未来有什么不变。
因为战略要建立在不变的事物上。
我用了“云(Cloud)上升明月,天涯共此时(era)”这句话,不仅因为这里有一点点“藏头”的小聪明,更重要的是还有“明月”这个意向。在我们的文化里,明月是象征着永恒的,比如“秦时明月汉时关,万里长征人未还”、“人生代代无穷已,江月年年只相似”……
Cloudera 成立于 2008 年,上云固然是他这两年的重大转型,然而不管云、线下部署、还是 saas,都只是某个特定时间或空间内的潮流,可能转瞬即逝。
唯有客户要从数据中寻找价值的需求是不变的。
潮流散尽方显产品本色。好的产品应该像明月,可以借助潮流,可以被潮流所掩盖,但终将穿越潮流而熠熠生辉。
愿 CDP 如此。
版权声明: 本文为 InfoQ 作者【郭华】的原创文章。
原文链接:【http://xie.infoq.cn/article/6e226d8422b19fab340e76680】。文章转载请联系作者。
评论