Apache Flink - Flink vs Spark vs Hadoop



这是一个综合表格,展示了三个最流行的大数据框架之间的比较:Apache Flink、Apache Spark 和 Apache Hadoop。

Apache Hadoop Apache Spark Apache Flink

起源年份

2005 2009 2009

起源地

MapReduce (Google) Hadoop (雅虎) 加州大学伯克利分校 柏林工业大学

数据处理引擎

批处理 批处理 流处理

处理速度

慢于 Spark 和 Flink 比 Hadoop 快 100 倍 比 Spark 快

编程语言

Java、C、C++、Ruby、Groovy、Perl、Python Java、Scala、Python 和 R Java 和 Scala

编程模型

MapReduce 弹性分布式数据集 (RDD) 循环数据流

数据传输

批处理 批处理 流水线和批处理

内存管理

基于磁盘 JVM 管理 主动管理

延迟

中等

吞吐量

中等

优化

手动 手动 自动

API

低级 高级 高级

流处理支持

不支持 Spark Streaming Flink Streaming

SQL 支持

Hive、Impala SparkSQL 表 API 和 SQL

图支持

不支持 GraphX Gelly

机器学习支持

不支持 SparkML FlinkML
广告