如果小波变换后的数据长度与原始数据长度相同,那么这种技术如何用于数据降维?
其效用在于小波变换后的数据可以被压缩。通过只保存小波系数中一小部分主要系数,可以保留信息的压缩近似值。例如,可以保留高于某个用户定义阈值的所有小波系数。其他一些系数设置为0。
由此产生的数据描述非常稀疏,因此如果在小波空间中实现,可以利用数据稀疏性的服务在计算上非常快速。该方法还可以去除噪声而不会平滑数据的特性,使其也适用于数据清洗。给定一组系数,可以使用DWT的反过程生成原始数据的近似值。
DWT通常与离散傅里叶变换(DFT)相关,DFT是一种包含正弦和余弦的信号处理方法。一般来说,DWT可以实现良好的有损压缩。如果对给定数据向量的DWT和DFT保留相似数量的系数,则DWT版本将支持对原始记录更有效的近似。
因此,对于相同的近似值,DWT需要的空间比DFT少。与DFT不同,小波在空间上是完全局部化的,有助于局部元素的保存。只有一个DFT,但有多个DWT族。
有一些著名的小波变换,例如Haar-2、Daubechies-4和Daubechies-6变换。使用离散小波变换的一般过程促进了分层金字塔算法,该算法在每次迭代中将记录减半,从而提高了计算速度。该方法如下:
输入数据向量的长度L应该是2的幂。可以通过根据需要用零填充数据向量来满足此条件(L ≥ n)。
每次变换都涉及使用两个函数。第一个函数使用各种数据平滑方法,包括求和或加权平均。第二个函数实现加权差分,有助于突出数据的细节特征。
这两个函数用于X中的数据点对,即所有数据对(x2i,x2i+1)。这将产生两个长度为L/2的数据集。一般来说,这些分别定义了输入记录的平滑或低频版本及其高频内容。
这两个函数递归地应用于前面循环中获得的数据集,直到获得的数据集长度为2。
可以选择来自后续迭代中获得的数据集的值作为变换数据的 小波系数。
广告
数据结构
网络
关系数据库管理系统 (RDBMS)
操作系统
Java
iOS
HTML
CSS
Android
Python
C语言编程
C++
C#
MongoDB
MySQL
Javascript
PHP