离散余弦变换

编辑本段基本介绍

最常用的一种离散余弦变换的类型是下面给出的第二种类型，通常我们所说的离散余弦变换指的就是这种。它的逆，也就是下面给出的第三种类型，通常相应的被称为" 反离散余弦变换" ，" 逆离散余弦变换" 或者" IDCT " 。

有两个相关的变换，一个是离散正弦变换(DST for Discrete Sine Transform), 它相当于一个长度大概是它两倍的实奇函数的离散傅里叶变换；另一个是改进的离散余弦变换(MDCT for Modified Discrete Cosine Transform), 它相当于对交叠的数据进行离散余弦变换。

编辑本段主要应用

离散余弦变换，尤其是它的第二种类型，经常被信号处理和图像处理使用，用于对信号和图像(包括静止图像和运动图像) 进行有损数据压缩。这是由于离散余弦变换具有很强的" 能量集中" 特性:大多数的自然信号(包括声音和图像) 的能量都集中在离散余弦变换后的低频部分，而且当信号具有接近马尔科夫过程(Markov processes)的统计特性时，离散余弦变换的去相关性接近于K-L 变换(Karhunen-Loève 变换--它具有最优的去相关性) 的性能。

例如，在静止图像编码标准JPEG 中，在运动图像编码标准MJPEG 和MPEG 的各个标准中都使用了离散余弦变换。在这些标准制中都使用了二维的第二种类型离散余弦变换，并将结果进行量化之后进行熵编码。这时对应第二种类型离散余弦变换中的n 通常是8，并用该公式对每个8x8块的每行进行变换，然后每列进行变换。得到的是一个8x8的变换系数矩阵。其中(0,0)位置的元素就是直流分量，矩阵中的其他元素根据其位置表示不同频率的交流分类。

一个类似的变换, 改进的离散余弦变换被用在高级音频编码(AAC for Advanced Audio Coding)，Vorbis 和 MP3 音频压缩当中。

离散余弦变换也经常被用来使用谱方法来接偏微分方程，这时候离散余弦变换的不同的变量对应着数组两端不同的奇/偶边界条件。编辑本段计算方式

尽管直接使用公式进行变换需要进行O(n2)次操作，但是和快速傅里叶变换类似，我们有复杂度为O(nlog(n))的快速算法，这就是常常被称做蝶形变换的一种分解算法。另外一种方法是通过快速傅里叶变换来计算DCT ，这时候需要O(n)的预操作和后操作。

编辑本段参考资料

K. R. Rao and P. Yip, 离散余弦变换 : 算法、优点和应用 (Discrete Cosine Transform: Algorithms, Advantages, Applications) (Academic Press, Boston, 1990).

A. V. Oppenheim, R. W. Schafer, and J. R. Buck, 时间离散信号处理 (Discrete-Time Signal Processing), second edition

(Prentice-Hall, New Jersey, 1999).

S. A. Martucci, 对称卷积和离散正弦余弦变换 (Symmetric

convolution and the discrete sine and cosine transforms), IEEE Trans. Sig. ProcessingSP-42, 1038-1051 (1994).

Matteo Frigo and Steven G. Johnson: FFTW, http://www.fftw.org/. 一个免费的C 语言库GPL ，可以计算DCT-I~IV的1维到多维的任意大小的变换

M. Frigo and S. G. Johnson, "FFTW3的设计和实现," Proceedings of the IEEE93 (2), 216–231 (2005).

编辑本段改进的离散余弦变换

改进的离散余弦变换（Modified Discrete Cosine Transform, MDCT）是一种与傅立叶变换相关的变换，以第四型离散余弦变换（DCT-IV ）为基础，重叠性质如下：它是应用于处理较大的资料集合，当连续的资料区块中，当前的资料区块跟后续的资料区块有重叠到的情形；即当前资料区块的后半段与下一个资料区块的前半段为重叠的状态。这样的重叠情形，除了具有离散余弦变换（Discrete Cosine Transform, DCT）的能量压缩特性外，也使这种变换在应用于信号压缩时更引人注目。因为它有助于避免由于资料区块边界所产生的多余资料。因此，这种变换可应用于MP3，AC-3， ogg vorbis，和AAC 的音频压缩等方面。

改进的离散余弦变换是由Princen ，Johnson 和Bradley 承接早前（1986年）Princen 和Bradley 所提出关于时域混叠消除法（Time-Domain Aliasing Cancellation, TDAC ）的改进的离散余弦变换基本定理，于1987年所提出，详述如下。至于其他类似的变换还有如以离散正弦变换为基础的改进的离散正弦变换（Modified Discrete Sine Transform, MDST）。以及其他较少使用的变换，例如以其他不同类型的DCT 或DCT/DST的组合为基础的改进的离散余弦变换。

在MP3的应用上，改进的离散余弦变换，并不适用于直接处理音频信号，而适用于处理32波段多相正交滤波器（Polyphase quadrature filter, PQF ）阵列的输出端信号。这样的改进的离散余弦变换输出是由一个混叠削减公式作后置处理，用以减少多相正交滤波器阵列的特殊混叠。这样的改进的离散余弦变换与滤波器阵列组合，被称作混合滤波器阵列或子带改进的离散余弦变换。相反地，AAC 通常使用一个纯粹的改进的离散余弦变换；

仅Sony 公司使用的MPEG – 4 AAC - SSR技术采用了运用改进的离散余弦变换的四波段多相正交滤波器阵列（但也是很少使用）。自适应听觉变换编码（Adaptive TRansfeorm Acoustic Coding, ATRAC）利用运用改进的离散余弦变换的堆叠型正交镜像滤波器（Quadrature Mirror Filter, QMF ）。