Master
平台

Apache Pinot

Published: Apr 13, 2021
Apr 2021
评估?

Apache Pinot是分布式 OLAP 数据存储系统,旨在提供低延迟的实时分析。它可以从批处理数据源(例如 Hadoop HDFS、Amazon S3、Azure ADLS或Google Cloud Storage)以及流式数据源(例如 Apache Kafka )中提取数据。如果需要进行面向用户的低延迟数据分析,则 Hadoop SQL 方案不能保证所需的低延迟。诸如 Apache Pinot(或Apache DruidClickhouse等)现代 OLAP 引擎,可以实现低得多的延迟,特别适合针对不可变数据(如聚合)进行快速分析的场景(或许需要进行实时数据提取)。 Apache Pinot 最初由 LinkedIn 构建,并于2018年底进入Apache孵化阶段。此后,该系统又增加了插件架构和SQL支持等关键特性。 Apache Pinot 的操作相当复杂,并且具有许多需要控制的部件,但是如果需要分析的数据量足够大,并且对查询要求低延迟,则建议评估一下 Apache Pinot。