Master
Plataformas

Apache Pinot

Published: Apr 13, 2021
Apr 2021
Avalie?

Apache Pinot é um armazenamento de dados OLAP distribuído, construído para fornecer análises em tempo real com baixa latência. Ele pode ingerir de fontes de dados em lote (como Hadoop HDFS, Amazon S3, Azure ADLS ou Google Cloud Storage), bem como fontes de dados de stream (como Apache Kafka). Se a necessidade for uma análise de baixa latência voltada para o usuário, as soluções SQL-on-Hadoop não oferecem a baixa latência necessária. Mecanismos OLAP modernos como Apache Pinot (ou Apache Druid e Clickhouse, entre outros) podem atingir latência muito menor e são particularmente adequados em contextos em que análises rápidas, como agregações, são necessárias em dados imutáveis, possivelmente, com ingestão de dados em tempo real. Construído originalmente pelo LinkedIn, o Apache Pinot entrou na incubação da Apache no final de 2018 e, desde então, adicionou uma arquitetura de plugin e suporte a SQL, entre outros recursos importantes. O Apache Pinot pode ser bastante complexo de operar e tem muitas partes móveis, mas se seus volumes de dados forem grandes o suficiente e você precisar de capacidade de consulta de baixa latência, recomendamos que avalie o Apache Pinot.