Weka - 启动资源管理器
在本章中,让我们深入了解资源管理器提供的各种功能,这些功能可用于处理大数据。
当您在“应用程序”选择器中单击“资源管理器”按钮时,将打开以下屏幕:
在顶部,您将看到以下几个选项卡:
- 预处理
- 分类
- 聚类
- 关联
- 选择属性
- 可视化
在这些选项卡下,有几个预先实现的机器学习算法。现在让我们详细了解一下每个算法。
预处理选项卡
最初,当您打开资源管理器时,只有“预处理”选项卡可用。机器学习的第一步是对数据进行预处理。因此,在“预处理”选项中,您将选择数据文件,对其进行处理并使其适合应用各种机器学习算法。
分类选项卡
“分类”选项卡为您提供了多种用于对数据进行分类的机器学习算法。举几个例子,您可以应用线性回归、逻辑回归、支持向量机、决策树、随机树、随机森林、朴素贝叶斯等算法。列表非常详尽,提供了监督和无监督机器学习算法。
聚类选项卡
在“聚类”选项卡下,提供了多种聚类算法,例如 SimpleKMeans、FilteredClusterer、HierarchicalClusterer 等。
关联选项卡
在“关联”选项卡下,您将找到 Apriori、FilteredAssociator 和 FPGrowth。
选择属性选项卡
“选择属性”允许您基于多种算法(例如 ClassifierSubsetEval、PrinicipalComponents 等)进行特征选择。
可视化选项卡
最后,“可视化”选项允许您可视化已处理的数据以进行分析。
如您所见,WEKA 提供了多种现成的算法,用于测试和构建您的机器学习应用程序。要有效地使用 WEKA,您必须对这些算法有扎实的了解,了解它们的工作原理,在什么情况下选择哪种算法,在处理后的输出中寻找什么等等。简而言之,您必须拥有机器学习的坚实基础才能有效地使用 WEKA 构建您的应用程序。
在接下来的章节中,您将深入研究资源管理器中的每个选项卡。
广告