O DuckLake é um formato integrado de data lake e catálogo que simplifica a arquitetura de Lakehouse usando bancos de dados SQL padrão para gerenciar o catálogo e os metadados. Enquanto formatos abertos de tabelas tradicionais, como Iceberg ou Delta Lake, dependem de estruturas complexas de metadados baseadas em arquivos, o DuckLake armazena os metadados em um banco de dados de catálogo (por exemplo, SQLite, PostgreSQL ou DuckDB) enquanto persiste os dados como arquivos Parquet no disco local ou em armazenamento de objetos compatível com S3. Essa abordagem híbrida melhora a latência de planejamento de consultas e a confiabilidade transacional durante atualizações concorrentes. DuckDB atua como mecanismo de consulta por meio da extensão ducklake, oferecendo uma interface SQL familiar para operações DDL e DML padrão. Ele também preserva características de lakehouse, como particionamento, mas omite índices e chaves primárias e estrangeiras. Com suporte para time travel, evolução de esquema e conformidade ACID, o DuckLake oferece uma opção de baixa complexidade para times que buscam uma stack analítica autônoma. Embora ainda esteja em estágio inicial de maturidade, o DuckLake é uma alternativa leve e promissora às arquiteturas de lakehouse tradicionais. Ele evita o overhead operacional associado a ecossistemas baseados em Spark ou Trino, o que o torna uma boa opção para ambientes de dados mais enxutos.