写点什么

Snowflake vs. Redshift 的 2022 战报:两个数据平台谁更适合你?

作者:麦聪软件
  • 2022 年 7 月 30 日
  • 本文字数:2927 字

    阅读完需:约 10 分钟

Snowflake vs. Redshift的2022战报:两个数据平台谁更适合你?

导读:Snowflake 和 Redshift 都是流行的数据平台,哪种更适合你的业务需求?下面将从 5 个角度逐一对比解读。

数字化转型让企业更具竞争力,因此,数据分析和数据管理变得至关重要。但是随着需要分析的数据量迅速增加,企业需要一种方法将所有数据集中在一个地方,以便进行分析。

进入基于云的现代数据仓库,例如 Snowflake 和 AWS Redshift 都是备受推崇的数据仓库平台。这两者都提供商业智能和数据分析应用程序所需的数量、速度和质量。

但是,尽管这些数据仓库平台之间有许多相似之处,但它们各自都有不同的方向。因此,选择通常归结为平台偏好和企业数据策略的适用性。


Snowflake vs. Redshift

一、Snowflake 与 Redshift:主要特征的比较

Snowflake 是用于结构化和半结构化数据的关系数据库管理系统和分析数据仓库。它通过 SaaS 模型提供服务,使用 SQL 数据库引擎来管理信息在数据库中的存储方式。它处理对整个仓库中虚拟仓库的查询,每个仓库都在自己的集群节点中,独立于其他节点,不共享计算资源。

位于此之上的是用于身份验证、基础架构管理、查询、访问控制等的云服务。Snowflake Elastic Data Warehouse 使用户能够利用 Amazon S3 或 Azure 资源分析和存储数据。

AWS Redshift 将自己定位为 PB 级数据仓库服务,可供 BI 工具用于分析。用户可以轻松地放大和缩小。与 Snowflake 一样,Redshift 为用户提供独立集群。这些集群还用于负载平衡以提高性能。

Redshift 提供了良好的查询性能,这得益于高带宽连接、由于全球众多的 AWS 数据中心而靠近用户,以及定制的通信协议。由于 AWS 中存在许多服务,用户可以轻松访问其 Redshift 数据集的可靠备份。

比较两个数据仓库的特性,Snowflake 对基于 JSON 的函数的支持更强大,数据库维护自动化也更好。另一方面,Redshift 需要更多的手动维护工作。两者都提供列式存储和大规模并行处理 (MPP),以实现同步分析计算和快速查询,即使在巨大的数据集上也是如此。

Snowflake 将计算、存储和云服务分开,尽管它提供并发扩展。Redshift 一直在追赶这些功能,现在也不甘落后。

结论:第一局,Snowflake 因更多的功能而胜出。


二、Snowflake 与 Redshift:易用性的比较

Snowflake 对用户提供更直观的 SQL 界面,可以轻松设置和运行。同时,Redshift 的用户体验也非常友好的,日常使用几乎不需要管理,支持多种数据输出格式,包括 JSON。具有 SQL 背景的人会发现利用 PostgreSQL 处理数据很容易。

两个数据仓库平台都提供在线支持,但 Snowflake 还提供 7* 24 实时支持。与 Snowflake 相比,Redshift 稍微复杂一些,并且由于缺乏自动化而需要更多的 IT 管理来维护。而 Snowflake 可以自动执行数据清理、压缩、诊断和其他功能。

并且,在使用 Snowflake 进行扩展操作期间无需复制数据,Redshift 确实需要一些复制和其他管道。同样,在第三方数据共享和访问以进行分析方面,Snowflake 使整个过程变得更加容易。Snowflake 支持结构化和半结构化,而 Redshift 缺乏对半结构化数据类型的支持。

结论:第二局,Snowflake 获胜。


三、Snowflake 与 Redshift:安全性的比较

Redshift 在安全性和合规性方面获得了一些关键分数。这些功能针对所有用户全面实施。此外,Redshift 可用于访问管理、集群加密、集群安全组、传输中和静态数据加密、SSL 连接安全性和登录凭证安全性。访问权限是细粒度的,并且可以非常本地化。

因此,Redshift 可以轻松限制对集群的入站或出站访问。该网络还可以在虚拟私有云(VPC) 中隔离,并通过 VPN 链接到 IT 基础设施。

Snowflake 还拥有永远在线的加密、网络隔离和其他强大的安全功能。但与 AWS 不同的是,它的安全功能是分层的,每一层的成本更高。然而,从好的方面来说,您最终不会为不需要或不想要的安全功能付费。

结论:第三局,Redshift 在安全性方面获胜。


四、Snowflake 与 Redshift:集成度的比较

显然,那些已经使用 AWS 平台的人会发现 Redshift 与 Athena、DMS、DynamoDB 和 CloudWatch 等服务的无缝集成。

Snowflake 在 AWS Marketplace 上,但并没有嵌入 AWS 生态系统,并且缺乏 AWS 可以召集的供应商合作伙伴关系的深度和广度。在某些情况下,将 Snowflake 与其他工具集成可能具有挑战性。

但在其他情况下,Snowflake 是高度集成的,包括 Tableau、Apache Spark、IBM Cognos 和 Qlik 都完全集成。那些使用这些工具的人会发现分析很容易完成。

结论:第四局,Redshift 因集成的表现而获胜。


五、Snowflake 与 Redshift:价格的比较

按需定价是 Snowflake 和 Redshift 这两种产品的特点。但这两个数据仓库平台采用了不同的打包方式。

Snowflake 在其定价结构中将计算和存储分开,而 Redshift 将两者结合定价。Snowflake 自动为所有版本提供并发扩展,无需额外费用。Redshift 提供专用量的每日并发扩展。但是,如果超过,您将按秒收费。

Redshift 的长期合同有很大的折扣。客户可以按小时收费(按类型和集群节点)或按字节扫描量收费。Snowflake 的定价更加复杂,有五个不同的版本,从基本版本开始价格会随着您的升级而上涨。

因此,它们之间的差异使得很难进行完整的比较。建议用户评估支持其预测数据量、处理量和分析要求所需的资源。对于一些用户来说,AWS 会更便宜,而对于另一些用户来说,Snowflake 会领先。

粗略地说,Redshift 的费用约为每小时 25 美分,而 Snowflake 的费用约为每月 40 美元。但是使用率会因工作负载而有很大差异。一些用户表示,Redshift 的按需定价成本更低,而大型数据集在 Snowflake 上的成本更高,因为它的计算和存储定价是分开的。

结论:第五局,Snowflake 和 Redshift 算是打个平手。


六、Snowflake 与 Redshift:总结

Snowflake 和 Redshift 都是用于数据分析的数据仓库。每个都有其优点和缺点。比较归结为使用模式、数据量、工作负载和数据策略。

Redshift 不适合事务处理应用程序。如果数据模式意味着不断发生字节扫描,那么定价可能会失控。但是,当涉及更高级别时,Snowflake 的定价也可能会升级。如果您需要最高级别的最高功能和安全性,AWS 可能会是更好的选择。

有人说,当您从小处着手并逐渐扩大规模时,Snowflake 会更好,而 Redshift 最适合主要的企业级实现。但这些都是普遍性的比较,并不总是成立。每个企业都需要研究哪种选择产生的成本最低,更好地工作。

麦聪 DaaS 平台产品架构图:麦聪 DaaS + 数据库(湖) = 数据中台/类 Snowflake

对于一些人来说,Redshift 的计算和存储捆绑将使其更便宜。但相反的情况可能适用于其他工作负载。在这些情况下,Snowflake 拆分计算和存储定价的能力可能是最好的。

另一个区别点是 JSON 存储。两者都支持它,但 Snowflake 提供了更多选择。那些有大量 JSON 流量和查询的人最好使用 Snowflake。

然后是 AWS 的影响力。Snowflake 在 Amazon 上运行,但由于与整个 Amazon 生态系统集成得更好,重度 AWS 用户最好使用 Redshift。

最后,Snowflake 在实时应用程序数据库中运行良好,而 Redshift 则不行。最终,由用户通过检查他们的工作负载的适用性来确定,权衡这两种数据平台中的哪一种更适合他们的数据模式。

全球领先的麦聪 DaaS 平台,可以帮助企业快速构建下一代数据中台:麦聪 DaaS + 数据库(湖) = 数据中台/类 Snowflake。麦聪 DaaS 平台支持元数据管理,数据治理,数据开发,数据服务化,数据市场等功能,500 强客户中已有 30 多家选择麦聪 DaaS 平台。

欢迎到官网注册下载免费试用:http://www.maicongs.com/#/home/probation

用户头像

麦聪软件

关注

全球领先的DaaS厂商,构建下一代数据中台 2020.06.29 加入

500强集团企业中已有30家选用,支持元数据管理,数据治理,数据开发,数据服务化,数据市场等功能,欢迎浏览官网:maicongs.com

评论

发布
暂无评论
Snowflake vs. Redshift的2022战报:两个数据平台谁更适合你?_麦聪软件_InfoQ写作社区