基于支持期望的技术有哪些?


有两种方法可以确定模式的预期支持,一种是使用(概念层次结构),另一种是基于邻域的方法,称为间接关联。

基于概念层次结构的支持期望

仅依靠客观指标不足以去除无趣的非频繁模式。例如,考虑面包和笔记本电脑是频繁项。即使项目集 {面包,笔记本电脑} 不频繁且可能负相关,它也不令人感兴趣,因为其缺乏支持对于领域专家来说是显而易见的。因此,需要一种主观方法来确定预期支持,以防止生成此类非频繁模式。

基于间接关联的支持期望

考虑一对商品 (a, b),它们被客户一起购买的频率很高。如果 a 和 b 是不相关的商品,例如面包和 DVD 播放器,那么它们的预期支持度就会很低。换句话说,如果 a 和 b 是相关的商品,那么它们的预期支持度就会很高。预期支持以前是利用概念层次结构计算的。这展示了一种通过查看其他商品通常与这两个商品一起购买来确定商品对之间预期支持的方法。

例如,考虑购买睡袋的客户也倾向于购买其他露营用品,而购买台式电脑的客户也倾向于购买其他电脑配件,包括光学鼠标或打印机。考虑到没有其他商品与睡袋和台式电脑一起频繁购买,因此这些不相关商品的支持度应该很低。

换句话说,假设薯片和饼干与节食汽水和普通汽水一起购买。即使不使用概念层次结构,这两对商品也预计具有适度的关联性,并且它们的支撑度应该很高。由于它们的实际支持度很低,因此节食汽水和普通汽水形成了一个有趣的非频繁模式。此类模式称为间接关联模式。

间接关联有很多应用,例如在市场购物篮领域,a 和 b 可以定义竞争商品,例如台式电脑和笔记本电脑。在文本挖掘中,间接关联可用于识别同义词、反义词或在多种上下文中使用的词语。例如,给定一组文件,单词“数据”可以通过中介挖掘间接地与“黄金”相关联。

更新日期: 2022年2月14日

93 次浏览

开启你的职业生涯

通过完成课程获得认证

立即开始
广告