scipy.cluster.vq 模块中哪个函数用于对每个特征维度上的观测值进行归一化?


在实施 k 均值算法之前,重新缩放观测集的每个特征维度总是有益的。函数 scipy.cluster.vq.whiten(obs, check_finite = True) 用于此目的。为了使其具有单位方差,它将观测值的每个特征维度除以其标准差 (SD)。

参数

以下是函数 scipy.cluster.vq.whiten(obs, check_finite = True) 的参数:−

  • obs− ndarray

它是一个要重新缩放的数组,其中每一行都是一个观测值,列是在每次观测期间看到的特征。示例如下:−

obs = [[ 1., 1., 1.],
   [ 2., 2., 2.],
   [ 3., 3., 3.],
   [ 4., 4., 4.]]
  • check_finite− bool,可选

此参数用于检查输入矩阵是否仅包含有限数字。禁用此参数可能会提高性能,但如果观测值确实包含无穷大,也可能导致某些问题,例如崩溃或不终止。此参数的默认值为 True

返回值

它返回一个数组,其中包含按每列的 SD 缩放的 obs 中的值。

示例

import numpy as np
from scipy.cluster.vq import whiten
observations = np.array([[2.9, 1.3, 1.9],
   [1.7, 3.2, 1.1],
   [1.0, 0.2, 1.7,]])
whiten(observations)

输出

array([[3.69627581, 1.04908478, 5.58930985],
   [2.16678237, 2.58236253, 3.23591623],
   [1.27457787, 0.16139766, 5.00096145]])

更新于: 2021年11月23日

105 次查看

开启您的 职业生涯

通过完成课程获得认证

开始学习
广告

© . All rights reserved.