Weka 是什么?



WEKA 是一款开源软件,它提供数据预处理工具、若干机器学习算法的实现和可视化工具,以便开发者能够开发机器学习技术并将其用于实际的数据挖掘问题。WEKA 提供的功能摘要如下所示 −

Weka Summarized

如果你观察图片流的开头,就会发现处理大数据以使其适用于机器学习有很多步骤 −

首先,你会从现场收集的原始数据开始。此数据可能包含多个空值和不相关字段。可使用 WEKA 中提供的数据预处理工具来清理数据。

然后,会将经过预处理的数据保存到本地存储中,以便应用机器学习算法。

接下来,根据要开发的机器学习模型的类型,可以在“分类”、“聚类”或“关联”等选项中选择一个。属性选择可自动选择特征以创建缩减后的数据集。

请注意,在每个类别中,WEKA 都提供了若干算法的实现。开发者可以选择一种算法,设置所需的参数,并在数据集上运行它。

随后,WEKA 会提供模型处理的统计输出。它提供了一个可视化工具来检查数据。

可以将各种模型应用于同一数据集。然后可以比较不同模型的输出,并选择最符合开发目标的模型。

因此,使用 WEKA 可以更快地开发机器学习模型。

既然已经了解了 WEKA 是什么以及它有什么作用,在下一章中,我们将学习如何将 WEKA 安装到本地计算机。

广告