- Apache Flink 教程
- Apache Flink - 首页
- Apache Flink - 大数据平台
- 批处理 vs. 实时处理
- Apache Flink - 简介
- Apache Flink - 架构
- Apache Flink - 系统要求
- Apache Flink - 设置/安装
- Apache Flink - API 概念
- Apache Flink - 表 API 和 SQL
- 创建 Flink 应用程序
- Apache Flink - 运行 Flink 程序
- Apache Flink - 库
- Apache Flink - 机器学习
- Apache Flink - 使用案例
- Apache Flink - Flink vs. Spark vs. Hadoop
- Apache Flink - 结论
- Apache Flink 资源
- Apache Flink - 快速指南
- Apache Flink - 有用资源
- Apache Flink - 讨论
Apache Flink - 机器学习
Apache Flink 的机器学习库称为 FlinkML。随着在过去 5 年中机器学习的使用呈指数级增长,Flink 社区决定在其生态系统中添加此机器学习 APO。FlinkML 中的贡献者和算法列表正在不断增加。此 API 尚未成为二进制分发的一部分。
下面是使用 FlinkML 进行线性回归的示例 -
// LabeledVector is a feature vector with a label (class or real value) val trainingData: DataSet[LabeledVector] = ... val testingData: DataSet[Vector] = ... // Alternatively, a Splitter is used to break up a DataSet into training and testing data. val dataSet: DataSet[LabeledVector] = ... val trainTestData: DataSet[TrainTestDataSet] = Splitter.trainTestSplit(dataSet) val trainingData: DataSet[LabeledVector] = trainTestData.training val testingData: DataSet[Vector] = trainTestData.testing.map(lv => lv.vector) val mlr = MultipleLinearRegression() .setStepsize(1.0) .setIterations(100) .setConvergenceThreshold(0.001) mlr.fit(trainingData) // The fitted model can now be used to make predictions val predictions: DataSet[LabeledVector] = mlr.predict(testingData)
在 flink-1.7.1/examples/batch/ 路径中,你会找到 KMeans.jar 文件。让我们运行此 FlinkML 示例。
使用默认点和质心数据集运行此示例程序。
./bin/flink run examples/batch/KMeans.jar --output Print
广告