如果小波变换后的数据长度与原始数据长度相同,那么这种技术如何用于数据降维?


其效用在于小波变换后的数据可以被压缩。通过只保存小波系数中一小部分主要系数,可以保留信息的压缩近似值。例如,可以保留高于某个用户定义阈值的所有小波系数。其他一些系数设置为0。

由此产生的数据描述非常稀疏,因此如果在小波空间中实现,可以利用数据稀疏性的服务在计算上非常快速。该方法还可以去除噪声而不会平滑数据的特性,使其也适用于数据清洗。给定一组系数,可以使用DWT的反过程生成原始数据的近似值。

DWT通常与离散傅里叶变换(DFT)相关,DFT是一种包含正弦和余弦的信号处理方法。一般来说,DWT可以实现良好的有损压缩。如果对给定数据向量的DWT和DFT保留相似数量的系数,则DWT版本将支持对原始记录更有效的近似。

因此,对于相同的近似值,DWT需要的空间比DFT少。与DFT不同,小波在空间上是完全局部化的,有助于局部元素的保存。只有一个DFT,但有多个DWT族。

有一些著名的小波变换,例如Haar-2、Daubechies-4和Daubechies-6变换。使用离散小波变换的一般过程促进了分层金字塔算法,该算法在每次迭代中将记录减半,从而提高了计算速度。该方法如下:

  • 输入数据向量的长度L应该是2的幂。可以通过根据需要用零填充数据向量来满足此条件(L ≥ n)。

  • 每次变换都涉及使用两个函数。第一个函数使用各种数据平滑方法,包括求和或加权平均。第二个函数实现加权差分,有助于突出数据的细节特征。

  • 这两个函数用于X中的数据点对,即所有数据对(x2i,x2i+1)。这将产生两个长度为L/2的数据集。一般来说,这些分别定义了输入记录的平滑或低频版本及其高频内容。

  • 这两个函数递归地应用于前面循环中获得的数据集,直到获得的数据集长度为2。

  • 可以选择来自后续迭代中获得的数据集的值作为变换数据的 小波系数。

更新于:2022年2月16日

189 次浏览

开启您的职业生涯

完成课程获得认证

开始学习
广告
© . All rights reserved.