- Apache Flink 教程
- Apache Flink - 首页
- Apache Flink - 大数据平台
- 批处理 vs 实时处理
- Apache Flink - 简介
- Apache Flink - 架构
- Apache Flink - 系统需求
- Apache Flink - 设置/安装
- Apache Flink - API 概念
- Apache Flink - 表格 API 和 SQL
- 创建 Flink 应用程序
- Apache Flink - 运行 Flink 程序
- Apache Flink - 库
- Apache Flink - 机器学习
- Apache Flink - 使用案例
- Apache Flink - Flink vs Spark vs Hadoop
- Apache Flink - 总结
- Apache Flink 资源
- Apache Flink - 快速指南
- Apache Flink - 有用资源
- Apache Flink - 讨论
Apache Flink - Flink vs Spark vs Hadoop
这是一个综合表格,展示了三个最流行的大数据框架之间的比较:Apache Flink、Apache Spark 和 Apache Hadoop。
Apache Hadoop | Apache Spark | Apache Flink | |
---|---|---|---|
起源年份 |
2005 | 2009 | 2009 |
起源地 |
MapReduce (Google) Hadoop (雅虎) | 加州大学伯克利分校 | 柏林工业大学 |
数据处理引擎 |
批处理 | 批处理 | 流处理 |
处理速度 |
慢于 Spark 和 Flink | 比 Hadoop 快 100 倍 | 比 Spark 快 |
编程语言 |
Java、C、C++、Ruby、Groovy、Perl、Python | Java、Scala、Python 和 R | Java 和 Scala |
编程模型 |
MapReduce | 弹性分布式数据集 (RDD) | 循环数据流 |
数据传输 |
批处理 | 批处理 | 流水线和批处理 |
内存管理 |
基于磁盘 | JVM 管理 | 主动管理 |
延迟 |
低 | 中等 | 低 |
吞吐量 |
中等 | 高 | 高 |
优化 |
手动 | 手动 | 自动 |
API |
低级 | 高级 | 高级 |
流处理支持 |
不支持 | Spark Streaming | Flink Streaming |
SQL 支持 |
Hive、Impala | SparkSQL | 表 API 和 SQL |
图支持 |
不支持 | GraphX | Gelly |
机器学习支持 |
不支持 | SparkML | FlinkML |
广告