如果小波变换后的数据长度与原始数据长度相同，那么这种技术如何用于数据降维？

数据挖掘数据库数据结构

其效用在于小波变换后的数据可以被压缩。通过只保存小波系数中一小部分主要系数，可以保留信息的压缩近似值。例如，可以保留高于某个用户定义阈值的所有小波系数。其他一些系数设置为0。

由此产生的数据描述非常稀疏，因此如果在小波空间中实现，可以利用数据稀疏性的服务在计算上非常快速。该方法还可以去除噪声而不会平滑数据的特性，使其也适用于数据清洗。给定一组系数，可以使用DWT的反过程生成原始数据的近似值。

DWT通常与离散傅里叶变换(DFT)相关，DFT是一种包含正弦和余弦的信号处理方法。一般来说，DWT可以实现良好的有损压缩。如果对给定数据向量的DWT和DFT保留相似数量的系数，则DWT版本将支持对原始记录更有效的近似。

因此，对于相同的近似值，DWT需要的空间比DFT少。与DFT不同，小波在空间上是完全局部化的，有助于局部元素的保存。只有一个DFT，但有多个DWT族。

有一些著名的小波变换，例如Haar-2、Daubechies-4和Daubechies-6变换。使用离散小波变换的一般过程促进了分层金字塔算法，该算法在每次迭代中将记录减半，从而提高了计算速度。该方法如下：

输入数据向量的长度L应该是2的幂。可以通过根据需要用零填充数据向量来满足此条件(L ≥ n)。
每次变换都涉及使用两个函数。第一个函数使用各种数据平滑方法，包括求和或加权平均。第二个函数实现加权差分，有助于突出数据的细节特征。
这两个函数用于X中的数据点对，即所有数据对(x_2i,x_2i+1)。这将产生两个长度为L/2的数据集。一般来说，这些分别定义了输入记录的平滑或低频版本及其高频内容。
这两个函数递归地应用于前面循环中获得的数据集，直到获得的数据集长度为2。
可以选择来自后续迭代中获得的数据集的值作为变换数据的小波系数。

Ginni

更新于：2022年2月16日

189 次浏览

开启您的职业生涯

完成课程获得认证

广告

© . All rights reserved.