高性能分析数据库 Impala 升级为 Apache 顶级项目

Apache 软件基金会宣布 Apache Impala 孵化成功,升级为顶级项目。

Impala 是一个高性能分析数据库,可针对存储在 Apache Hadoop 集群中的 PB 级数据进行闪电般快速的分布式 SQL 查询。Impala 还是一个现代化,大规模分布式,大规模并行的 C ++ 查询引擎,可以分析,转换和合并来自各种数据源的数据。大规模并行处理(MPP) SQL 查询引擎允许通过 SQL 或商业智能工具对存储在本地(在 HDFS 或 Apache Kudu 中)或在云对象存储中存储的数据进行分析查询,而无需将数据集迁移到专用系统或专有格式。

Impala 提供:

  • 在 Apache Hadoop 中查询大量数据(大数据)的能力;

  • 集群环境中的分布式查询;

  • 在不同组件之间共享数据文件的能力,无需复制或导出/导入步骤;

  • 用于大数据处理和分析的单一系统。

Impala 的灵感来自 Google 将查询处理与存储管理分离开来的 F1 数据库,最初于2012年发布,并于2015年12月进入 Apache 孵化。

Impala 项目创始人 Marcel Kornacker 表示:“2011年,我们开始开发 Impala ,以便为用户提供最先进的开源 SQL 分析。 Apache 顶级项目的毕业典礼是对这个项目背后的优秀开发者社区的肯定。”

Jump to original: 

高性能分析数据库 Impala 升级为 Apache 顶级项目