Master
Plataformas

Apache Pinot

Published: Apr 13, 2021
Apr 2021
Evaluar?

Apache Pinot es un almacén de datos distribuidos OLAP creado para ofrecer analíticas en tiempo real y con baja latencia. Puede alimentarse de fuentes de datos por lotes (como Hadoop HDFS, Amazon S3, Azure ADLS o Google Cloud Storage), así como de orígenes de datos en streams (como Apache Kafka). Si se necesita ofrecer al usuario análiticas de baja latencia, las soluciones de SQL-en-Hadoop no ofrecen la latencia que se necesita. Los motores OLAP modernos, como Apache Pinot (o Apache Druid y Clickhouse, entre otros), pueden lograr una latencia mucho menor y son particularmente adecuados en contextos donde se necesitan analíticas rápidas en tiempo real y con datos inmutables, como las agregaciones. Originalmente construido por LinkedIn, Apache Pinot ingresó a la incubadora de Apache a finales de 2018 y desde entonces ha obtenido una arquitectura de complementos y compatibilidad con SQL, entre otras capacidades clave. Apache Pinot puede ser bastante complejo de operar y tiene muchas partes móviles, pero recomendamos evaluarlo si los volúmenes de datos son lo suficientemente grandes y se necesita una capacidad de consulta de baja latencia.