Weka - 关联规则



人们观察到,购买啤酒的人同时也会购买尿布。也就是说,在购买啤酒和尿布之间存在关联。尽管这看起来不太令人信服,但这条关联规则是从大型超市数据库中挖掘出来的。类似地,花生酱和面包之间也可能存在关联。

发现这种关联对于超市来说至关重要,因为他们可以将尿布放在啤酒旁边,以便顾客可以轻松找到这两件商品,从而提高超市的销售额。

Apriori 算法是机器学习中的一种算法,它可以找出可能的关联并创建关联规则。WEKA 提供了 Apriori 算法的实现。在计算这些规则时,您可以定义最小支持度和可接受的置信度水平。您将把 Apriori 算法应用于 WEKA 安装中提供的 超市 数据。

加载数据

在 WEKA 浏览器中,打开 预处理 选项卡,点击 打开文件 ... 按钮,并从安装文件夹中选择 supermarket.arff 数据库。数据加载完成后,您将看到以下屏幕 -

Loading Data

该数据库包含 4627 个实例和 217 个属性。您可以很容易地理解检测如此大量的属性之间的关联有多么困难。幸运的是,借助 Apriori 算法,此任务可以自动化。

关联规则生成器

点击 关联规则 选项卡,然后点击 选择 按钮。选择 Apriori 关联规则,如屏幕截图所示 -

Associate Tab

要设置 Apriori 算法的参数,请点击其名称,将弹出一个窗口,如下所示,允许您设置参数 -

Apriori Algorithm

设置完参数后,点击 开始 按钮。过一段时间后,您将看到结果,如下面的屏幕截图所示 -

Start Parameters

在底部,您将找到检测到的最佳关联规则。这将有助于超市将其产品存放在合适的货架上。

广告