什么是scipy.cluster.hierarchy.fcluster()方法?
scipy.cluster.hierarchy.fcluster(Z,t,criterion=’inconsistent’depth=2,R=None, monocrat=None)− fcluster() 方法根据层次聚类结果形成扁平聚类。此层次聚类由给定的连接矩阵定义,识别聚类类之间的链接。
以下是其参数的详细解释:
参数
Z− ndarray
它表示用连接矩阵编码的层次聚类。
t− 标量
t 的值取决于标准的类型。对于“inconsistent”、“distance”和“monocrit”标准,t 的值表示形成扁平聚类时要应用的阈值。另一方面,对于“maxclust”和“maxclust_monocrit”标准,t 的值表示请求的最大聚类数。
criterion− str,可选
此参数表示用于形成扁平聚类的标准。标准的值可以是以下任何一个:
inconsistent− 不一致标准意味着聚类节点及其所有后代的不一致值小于或等于 t 的值。在这种情况下,聚类节点的叶子后代将属于同一个扁平聚类。而如果不是这种情况,则每个节点都将被分配到其自己的聚类。
distance− 距离标准将形成扁平聚类,其条件是每个扁平聚类中的原始观测值具有小于或等于 t 的共生距离。
maxclust− maxclust 标准将找到一个最小阈值 r。它确保相同扁平聚类中任意两个原始观测值之间的共生距离始终小于或等于 r 和 t。
monocrit− monocrit 标准将在 monocrit[i] <=t 时,从索引为 i 的聚类节点形成扁平聚类。
maxclust_monocrit− maxclust_monocrit 标准将在 monocrit[i] <=r 时,从索引为 i 的非单例聚类节点形成扁平聚类。
depth− int,可选
此参数表示执行不一致计算的最大深度。depth 参数的默认值为 2,并且对于任何其他标准都没有意义。
R− ndarray,可选
此参数表示要用于不一致标准的不一致矩阵。默认值为 NONE,如果未提供,则将计算矩阵。
monocrit− ndarray,可选
此参数是一个长度为 n-1 的数组。
返回值
flcuster− ndarray
它返回一个长度为 n 的数组。