元组 ID 传播是一种实现虚拟连接的方法,它极大地提高了多关系分类的效率。它们不是物理地连接关系,而是通过将目标元组的 ID 连接到非目标关系中的元组来虚拟地组合它们。在这种方法中,可以计算谓词,就好像实现了物理连接一样。元组 ID 传播是灵活且有效的,因为 ID 可以简单地在两个关系之间传播,只需要少量的数据传输和更多的存储空间。通过这样做,可以计算多个关系中的谓词,而冗余计算很少。元组 ID 传播必须与…阅读更多
顺序模式挖掘是挖掘频繁出现的系列事件或子序列作为模式。顺序模式的一个实例是购买佳能数码相机的用户会在一个月内购买惠普彩色打印机。对于零售信息,顺序模式有利于货架摆放和促销。这个行业,以及电信和其他企业,也可以使用顺序模式进行目标营销、用户留存和多项任务。顺序模式可用于的几个领域包括 Web 访问模式分析、天气预报、生产过程和 Web 入侵检测。给定一组序列,其中每个…阅读更多
STREAM 是一种单遍、常数元素近似算法,它是为 k-均值问题提出的。k-均值问题是将 N 个数据点聚类成 k 个聚类或组,使得点与其分配的聚类中心之间的平方误差和 (SSQ) 最小化。其思想是将相似的点分配到同一个聚类中,其中这些点与其他聚类中的点不同。在流数据模型中,数据点只能看到一次,并且内存和时间有限。它可以实现高质量的聚类,STREAM 算法以…阅读更多