Enable javascript in your browser for better experience. Need to know to enable it? Go here.
利用Data Mesh突破集中式平台瓶颈

利用Data Mesh突破集中式平台瓶颈

云、数据湖和数据仓库之间有什么共同点?它们都是集中式数据平台。虽然都是独一无二的,但它们都代表着组织在如何收集、分析和提取数据价值方面迈出了重要的一步。它们都有一个共同的目的:将大量的数据汇集起来,同时不遗余力地将它们转化为有价值的洞见。

 

这些架构是现代商业智能和分析的基础。因此,您可以对单一数据池中的数据提出任何问题,从而使团队能够更多地了解他们的客户、市场和运营。

 

好吧,这至少是个想法。

 

越来越多的场景下,集中式数据平台不能满足现代企业的需求。随着数据量的激增以及对商业智能和分析的需求飙升,一些集中式平台已经从“单一真实数据源”演变成了臃肿的洞见瓶颈。

 

 

集中式数据平台的新挑战

 

 

集中式数据平台本身并没有改变,而且在大多数情况下,依然能继续提供有意义的商业价值。但是,当涉及到处理今天的高级分析用例时,他们往往无法处理这个任务。

 

企业数据、洞见和分析的爆炸性需求带来了巨大压力。如今,这种压力正以三种具体方式表现出来:

 

 

  1. 周期长:随着集中式平台的膨胀,导入新数据所需的时间变得更长。这些漫长的周期使团队难以快速响应不断变化的业务需求,并大大降低了新数据交付的价值。

     

  2. 拥有成本高:许多集中式数据平台需要使用昂贵的专有技术来进行构建,并不适合于数据科学和研究。此外,随着数据量的增长,维护数据仓库和数据湖相关的成本和工作量也在增加。

     

  3. 遗留锁定:许多组织已经创建了集中式数据架构,其复杂程度导致前进无望。适应和接受新的数据管理最佳实践的能力是以获得尽可能大的价值为代价的。

 

诸如此类的挑战使企业无法实现集中式数据平台的最大承诺之一:从单一真实数据源快速提供深入而有价值的洞见。所以是时候重新考虑“用一个平台来统治一切”的范式了。

 

进入Data Mesh。

 

 

Data Mesh介绍

 

集中数据平台背后的理论是完备的。但在现实中,不同的业务领域需要更多的数据视野、管理技术和创造价值的用例。随着用例的多样性和平台规模的扩大,将所有企业数据整合到一个单一平台以实现高度多样化的价值用例,存在的问题也在增多。

 

一个明显的问题是创造新价值的速度缓慢。整合新的数据源可能需要几个月的时间,甚至可能不符合各个领域专家的个人价值案例。除此之外,大多数数据消费者甚至不需要访问所有企业数据。相反,他们需要一个有意义的、值得信赖的跨领域数据子集,其中包含他们想要的东西——不多也不少。或者说得更简单些,将量身定制的数据包装成产品。

 

数据与企业的功能领域保持一致(如销售、财务或库存管理),并成为Data Mesh中的一个产品。每个可用的领域都对这些数据产品和终端用户不断变化的需求负责,而一个总体的治理策略则保持了它们之间的互操作性。这种分散的数据管理方法在各职能团队之间分享所有权,所有人都可以自由地探索将数据用于最佳用途的新方法。

 

从商业角度来看,Data Mesh将最有可能从数据集中获得价值的人置于其控制之下。结果如何?突破瓶颈。洞察速度加快。而每个人都可以在管理和扩展其自定义数据集的同时,帮助自己获得相关的数据产品。在Data Mesh中添加新的数据源变得更容易、更快速,因为不需要修改现有的数据模式或处理管道。相反,新的数据产品是通过消耗其他数据产品的数据以及为其他消费者组合或增强这些数据而被引入网格的。

 

那么,Data Mesh在实际应用中是什么样子的呢?我们为一家依赖企业数据仓库的医疗保健公司引入了Data Mesh作为替代方案。新冠疫情爆发时,该组织仅用 13 天就迅速做出响应,在将新数据产品部署到Data Mesh的同时,还为他们的成员开发了一套护理应用程序。拥有近乎实时的数据,团队可以发表一些洞见,训练模型以及预测趋势,以优化其方法。以前的企业数据仓库无法做到这一点。

 

Data mesh graphic with Thoughtworks branded colors.

将产品和平台思维引入数据管理

 

 

Data Mesh结合了几种新兴的最佳技术实践,创建了一个新的数据管理范例——一个旨在满足现代组织和团队需求的范例。

 

首先,Data Mesh是基于自助服务平台设计原则来构建的,允许团队自助获得数据产品。新数据产品的创建有助于减少依赖集中式数据平台时所需的大量管理工作。每个人都有权服务自己,而非求助核心 IT 组。

 

Data Mesh也使用了产品思维的原则。团队可以将他们策划的数据集视为产品,同时将组织的小组、分析应用程序和数据科学家视为客户。而且,这些产品的管理与面向客户的外部产品一样严格,确保它们始终能满足依赖其洞察力的消费者的需求。

 

总之,平台设计和产品思维有助于实现分散、民主化的数据管理——通过这种新方法,有助于解决许多存在已久的质量和管理问题。

 

 

促成一个连续情报循环

 

 

Data Mesh在解锁数据、赋能功能团队和消除集中式数据平台产生的惯性方面非常出色。但这仅仅是他们在适当管理和实施时能够提供的运营价值的开始。

 

Data Mesh代表技术领导人几十年来一直试图实践的创新业务的飞跃:一个连续情报循环。

 

Image depicting the various phases of the data mesh cycle

上述的“情报循环”直观地展示了数据如何从情报和洞见转化为明智的商业决策。这些结果创建了新的数据,并最终更新了循环。这看起来可能很简单,但外观可能具有欺骗性。对于大多数组织来说,持续情报仍然难以实现,主要是因为他们在解锁数据、基于洞察快速采取行动或准确捕捉反馈方面存在困难。

 

Data Mesh有助于同时解决以下三个挑战:

 

  1. 定制、用户创建的数据产品有助于快速解锁有价值的数据。

     

  2. 对产品的民主化访问加速了洞见的生成,并将其交给能够采取行动的人。

     

  3. 团队通过直接查看和度量变化的影响来更新数据产品。

 

这就是让数据更接近最需要它和最了解它的人的作用。本质上,这正是Data Mesh支持和提供的内容。

 

 

Data Mesh适合您吗?

 

在数据管理方面,没有“一体适用”的解决方案。但是,如果您想了解更多关于Data Mesh的信息,以及我们如何助力组织实现它,请今天就与我们联系

 

 

了解更多关于Data Mesh