发布于 : Apr 13, 2021
不在本期内容中
这一条目不在当前版本的技术雷达中。如果它出现在最近几期中,那么它很有可能仍然具有相关参考价值。如果这一条目出现在更早的雷达中,那么它很有可能已经不再具有相关性,我们的评估将不再适用于当下。很遗憾我们没有足够的带宽来持续评估以往的雷达内容。
了解更多
Apr 2021
评估
Apache Pinot是分布式 OLAP 数据存储系统,旨在提供低延迟的实时分析。它可以从批处理数据源(例如 Hadoop HDFS、Amazon S3、Azure ADLS或Google Cloud Storage)以及流式数据源(例如 Apache Kafka )中提取数据。如果需要进行面向用户的低延迟数据分析,则 Hadoop SQL 方案不能保证所需的低延迟。诸如 Apache Pinot(或Apache Druid和Clickhouse等)现代 OLAP 引擎,可以实现低得多的延迟,特别适合针对不可变数据(如聚合)进行快速分析的场景(或许需要进行实时数据提取)。 Apache Pinot 最初由 LinkedIn 构建,并于2018年底进入Apache孵化阶段。此后,该系统又增加了插件架构和SQL支持等关键特性。 Apache Pinot 的操作相当复杂,并且具有许多需要控制的部件,但是如果需要分析的数据量足够大,并且对查询要求低延迟,则建议评估一下 Apache Pinot。