Master
平台

Snowflake

Published: Nov 20, 2019
Last Updated: Apr 13, 2021
Apr 2021
试验?

自从上次在雷达上提到 Snowflake 以来,对于它的使用,以及作为数据仓库和数据湖的替代方案的data mesh,我们都获得了更多经验。 Snowflake 在时间旅行、零拷贝克隆、数据共享及其应用市场等功能方面,继续给人留下深刻印象。Snowflake 至今还没出现任何令我们不喜欢的地方,所以相较于其他选择来说,我们的顾问会更偏爱使用它。亚马逊的数据仓库产品 Redshift 正在朝着将存储和计算进行分离的方向发展,而这一直都是 Snowflake 的强项。如果使用 Redshift 产品中的 Spectrum 特性进行数据分析,就会感觉它并非那么方便和灵活,部分原因是它受到了 Postgres 的约束(虽然我们也喜欢用Postgres。而进行联合查询(federated queries)可能是使用 Redshift 的原因。在操作方面,Snowflake 的操作会更简单。 虽然BigQuery是另一种选择,且非常易于操作,但在多云的场景下,Snowflake是更好的选择。我们已经在GCPAWS和AzureAzure上成功地使用了 Snowflake。

May 2020
试验?

对我们的很多客户来说,Snowflake 已被证明是一个健壮的 SaaS 大数据存储、数仓或数据湖解决方案。它拥有先进的架构,来扩展存储、算力和服务,以加载、卸载和使用数据。它也非常灵活,支持结构化、半结构化和非结构化数据。它为不同的访问模式(如用于数据科学的Spark和用于分析的 SQL),提供相应的 connector(数量正不断增加)。它也能运行在多种云平台上。对许多客户而言,我们建议公共系统(如大数据存储)要使用托管服务。然而,如果出于风险和法规的考虑,无法使用托管服务的话,那么 Snowflake 对于具有大数据量和大处理量的公司,是个不错的选择。我们已经成功地在中型项目中使用了 Snowflake ,但尚未在数据需要跨组织部门存储的大型生态系统中尝试过。

Nov 2019
评估?

我们经常将数据仓库和中心化的基础设施联系起来,而随着围绕数据的需求不断增长,中心化的基础设施是难以扩展和管理的。然而,Snowflake是一种全新的SQL数据仓库即服务解决方案,专为云平台而构建。Snowflake拥有大量精心设计的功能,例如数据库级的原子性,结构化和半结构化数据支持,数据库内分析功能,尤其是将存储、计算和服务层明确分离,从而解决了大多数数据仓库所面临的挑战。