Apache Flink - Flink vs Spark vs Hadoop

这是一个综合表格，展示了三个最流行的大数据框架之间的比较：Apache Flink、Apache Spark 和 Apache Hadoop。

	Apache Hadoop	Apache Spark	Apache Flink
起源年份	2005	2009	2009
起源地	MapReduce (Google) Hadoop (雅虎)	加州大学伯克利分校	柏林工业大学
数据处理引擎	批处理	批处理	流处理
处理速度	慢于 Spark 和 Flink	比 Hadoop 快 100 倍	比 Spark 快
编程语言	Java、C、C++、Ruby、Groovy、Perl、Python	Java、Scala、Python 和 R	Java 和 Scala
编程模型	MapReduce	弹性分布式数据集 (RDD)	循环数据流
数据传输	批处理	批处理	流水线和批处理
内存管理	基于磁盘	JVM 管理	主动管理
延迟	低	中等	低
吞吐量	中等	高	高
优化	手动	手动	自动
API	低级	高级	高级
流处理支持	不支持	Spark Streaming	Flink Streaming
SQL 支持	Hive、Impala	SparkSQL	表 API 和 SQL
图支持	不支持	GraphX	Gelly
机器学习支持	不支持	SparkML	FlinkML

打印页面