Enable javascript in your browser for better experience. Need to know to enable it? Go here.

Liquid clustering do Delta Lake

Publicado : Nov 05, 2025
Nov 2025
Experimente ?

Liquid clustering é uma técnica para tabelas do Delta Lake que funciona como alternativa ao particionamento e ao Z-ordering. Historicamente, otimizar tabelas Delta para desempenho de leitura exigia a definição de chaves de partição e Z-order no momento da criação da tabela, com base em padrões de consulta esperados. Modificar essas chaves posteriormente exigia a reescrita completa dos dados. Em contraste, clustering utiliza um algoritmo baseado em árvore para agrupar os dados segundo chaves designadas, que podem ser alteradas incrementalmente sem precisar reescrever todos os dados. Isso proporciona maior flexibilidade para suportar diversos padrões de consulta, reduzindo os custos de computação e melhorando o desempenho de leitura. Além disso, o Databricks Runtime para Delta Lake oferece suporte ao automatic liquid clustering, que analisa workloads de consulta históricos, identifica colunas ideais e agrupa os dados de acordo. Tanto usuários do Delta Lake standalone quanto do Databricks Runtime podem aproveitar o Liquid Clustering para otimizar o desempenho de leitura.

Baixe o PDF

 

 

 

English | Español | Português | 中文

Inscreva-se para receber a newsletter do Technology Radar

 

 

Seja assinante

 

 

Visite nosso arquivo para acessar os volumes anteriores