关联规则的工作原理是什么?
关联规则学习是一种无监督学习方法,它测试一个数据元素对另一个数据元素的依赖性,并创建相应的规则以提高效率。它试图发现数据集变量之间的一些有趣关系或关联。它依赖于多条规则来发现数据库中变量之间的有趣关系。
关联规则学习是机器学习中一项重要的技术,它被应用于市场篮子分析、Web使用挖掘、持续生产等领域。在市场篮子分析中,它被许多大型零售商广泛用于查找商品之间的关系。
在市场篮子分析中,通过发现用户购物篮中不同商品之间的关联来分析用户的购买习惯。通过发现这些关联,零售商可以分析用户通常购买哪些商品,从而制定营销策略。这种关联可以通过选择性营销和货架空间设计来影响销售额的增长。
多层关联规则的著名应用领域是市场篮子分析,它通过查找经常一起购买的商品组合来了解用户的购买习惯,这体现在概念层次结构的概念中。
关联规则始于包含一种或多种产品或服务的交易,以及关于交易的一些基本数据。为了分析的目的,产品和服务被称为项目。
这些交易通常只包含购买的商品。它可以使用诸如日期和时间以及用户是使用现金还是信用卡付款等数据。
每笔交易都为我们提供了哪些产品与哪些其他产品一起购买的数据。这显示在一个共现表中,该表显示某些产品对一起购买的次数。
这些观察结果是关联的实例,可以暗示一个正式规则,例如,如果用户购买苏打水,那么用户也会购买橙汁。在数据中,五笔交易中的两笔包含苏打水和橙汁。这两笔交易构成了该规则。该规则的支持度为五分之二,或 40%。
由于包含苏打水的两笔交易也包含橙汁,因此该规则的置信度也很高。因为三笔包含苏打水的交易中有两笔也包含橙汁,所以规则“如果苏打水,则橙汁”的置信度为 67%。反向规则“如果橙汁,则苏打水”的置信度较低。
广告