统计离群点检验分析两个假设;一个工作假设和一个备择假设。工作假设 H 是一个陈述,即 n 个对象的整个数据集来自一个初始分布模型 F,即 H:oi Î F,其中 i = 1, 2, n。如果没有任何统计上重要的证据支持拒绝该假设,则保留该假设。离群点检验检查对象 oi 相对于分布 F 是否本质上很大(或很小)。根据对数据的可用知识,已经提出了不同的检验统计量用于作为离群点检验。假设某些统计量... 阅读更多
聚类的方法多种多样,如下所示:分区方法 - 给定一个包含 n 个对象或数据元组的数据库,分区方法将信息划分为 k 个分区,其中每个分区定义一个聚类,并且 k < n。它可以将数据分配到 k 个组中,这些组可以满足以下必要条件:每个组必须至少包含一个对象。每个对象都应该准确地属于一个组。给定 k,要构建的分区的数量,分区方法会进行初始分区。然后,它使用迭代重定位方法,该方法试图通过转换... 阅读更多