降维与降数的区别是什么?
降维
在降维中,使用数据编码或转换来访问原始数据的简化或“压缩”表示。如果原始数据可以从压缩数据中无损地重建,则数据缩减称为无损压缩。如果重建的数据只是原始数据的近似值,则数据缩减称为有损压缩。
离散小波变换 (DWT) 与离散傅里叶变换 (DFT) 密切相关,后者是一种包含正弦和余弦的信号处理技术。通常,DWT 能够实现更好的有损压缩。也就是说,如果为给定数据向量的 DWT 和 DFT 保持相似数量的系数,则 DWT 版本将支持对原始数据的更准确近似。因此,对于等效的近似,DWT 需要比 DFT 更少的空间。
降数
在降数中,通过选择替代的、更小的数据表示形式来减少数据量。这些技术可以是参数化的或非参数化的。对于参数化方法,可以使用模型来估计数据,这样只需要保存数据参数,而不是实际数据,例如对数线性模型。非参数化方法用于存储数据的简化表示,包括直方图、聚类和抽样。
让我们看看降维和降数之间的比较。
降维 | 降数 |
---|---|
在降维中,应用数据编码或转换以获得原始数据的简化或压缩表示。 | 在降数中,通过选择替代的、更小的数据表示形式来减少数据量。 |
在降维中,离散小波变换 (DWT) 是一种线性信号处理技术,当应用于数据向量 X 时,会将其转换为数值不同的离散小波系数向量 X’。 这两个向量长度相同。当将此技术应用于数据缩减时,可以将每个元组视为一个 n 维数据向量,即 X=(x1,x2,…xn) 表示从 n 个数据库属性对元组进行的 n 次测量。 | 在降数中,可以使用回归和对数线性模型来逼近给定的数据。在线性回归中,数据建模为拟合一条直线。 例如,一个随机变量 y(称为响应变量)可以建模为另一个随机变量 x(称为预测变量)的线性函数,其方程为 y = wx+b,其中假设 y 的方差是恒定的。 |
它可用于去除无关和冗余属性。 | 它只是将原始数据表示为更小形式的一种技术。 |
在这种技术中,可能会丢失一些数据,这是不合适的。 | 在这种方法中,不会丢失数据,但所有数据都以更小的形式表示。 |
广告