离散余弦变换

编辑本段基本介绍

最常用的一种离散余弦变换的类型是下面给出的第二种类型,通常我们所说的离散余弦变换指的就是这种。它的逆,也就是下面给出的第三种类型,通常相应的被称为" 反离散余弦变换" ," 逆离散余弦变换" 或者" IDCT " 。

有两个相关的变换,一个是离散正弦变换(DST for Discrete Sine Transform), 它相当于一个长度大概是它两倍的实奇函数的离散傅里叶变换;另一个是改进的离散余弦变换(MDCT for Modified Discrete Cosine Transform), 它相当于对交叠的数据进行离散余弦变换。

编辑本段主要应用

离散余弦变换,尤其是它的第二种类型,经常被信号处理和图像处理使用,用于对信号和图像(包括静止图像和运动图像) 进行有损数据压缩。这是由于离散余弦变换具有很强的" 能量集中" 特性:大多数的自然信号(包括声音和图像) 的能量都集中在离散余弦变换后的低频部分,而且当信号具有接近马尔科夫过程(Markov processes)的统计特性时,离散余弦变换的去相关性接近于K-L 变换(Karhunen-Loève 变换--它具有最优的去相关性) 的性能。

例如,在静止图像编码标准JPEG 中,在运动图像编码标准MJPEG 和MPEG 的各个标准中都使用了离散余弦变换。在这些标准制中都使用了二维的第二种类型离散余弦变换,并将结果进行量化之后进行熵编码。这时对应第二种类型离散余弦变换中的n 通常是8,并用该公式对每个8x8块的每行进行变换,然后每列进行变换。得到的是一个8x8的变换系数矩阵。其中(0,0)位置的元素就是直流分量,矩阵中的其他元素根据其位置表示不同频率的交流分类。

一个类似的变换, 改进的离散余弦变换被用在高级音频编码(AAC for Advanced Audio Coding),Vorbis 和 MP3 音频压缩当中。

离散余弦变换也经常被用来使用谱方法来接偏微分方程,这时候离散余弦变换的不同的变量对应着数组两端不同的奇/偶边界条件。 编辑本段计算方式

尽管直接使用公式进行变换需要进行O(n2)次操作,但是和快速傅里叶变换类似,我们有复杂度为O(nlog(n))的快速算法,这就是常常被称做蝶形变换的一种分解算法。另外一种方法是通过快速傅里叶变换来计算DCT ,这时候需要O(n)的预操作和后操作。

编辑本段参考资料

K. R. Rao and P. Yip, 离散余弦变换 : 算法、优点和应用 (Discrete Cosine Transform: Algorithms, Advantages, Applications) (Academic Press, Boston, 1990).

A. V. Oppenheim, R. W. Schafer, and J. R. Buck, 时间离散信号处理 (Discrete-Time Signal Processing), second edition

(Prentice-Hall, New Jersey, 1999).

S. A. Martucci, 对称卷积和离散正弦余弦变换 (Symmetric

convolution and the discrete sine and cosine transforms), IEEE Trans. Sig. ProcessingSP-42, 1038-1051 (1994).

Matteo Frigo and Steven G. Johnson: FFTW, http://www.fftw.org/. 一个免费的C 语言库GPL ,可以计算DCT-I~IV的1维到多维的任意大小的变换

M. Frigo and S. G. Johnson, "FFTW3的设计和实现," Proceedings of the IEEE93 (2), 216–231 (2005).

编辑本段改进的离散余弦变换

改进的离散余弦变换(Modified Discrete Cosine Transform, MDCT)是一种与傅立叶变换相关的变换,以第四型离散余弦变换(DCT-IV )为基础,重叠性质如下:它是应用于处理较大的资料集合,当连续的资料区块中,当前的资料区块跟后续的资料区块有重叠到的情形;即当前资料区块的后半段与下一个资料区块的前半段为重叠的状态。这样的重叠情形,除了具有离散余弦变换(Discrete Cosine Transform, DCT)的能量压缩特性外,也使这种变换在应用于信号压缩时更引人注目。因为它有助于避免由于资料区块边界所产生的多余资料。因此,这种变换可应用于MP3,AC-3, ogg vorbis,和AAC 的音频压缩等方面。

改进的离散余弦变换是由Princen ,Johnson 和Bradley 承接早前(1986年)Princen 和Bradley 所提出关于时域混叠消除法(Time-Domain Aliasing Cancellation, TDAC )的改进的离散余弦变换基本定理,于1987年所提出,详述如下。至于其他类似的变换还有如以离散正弦变换为基础的改进的离散正弦变换(Modified Discrete Sine Transform, MDST)。以及其他较少使用的变换,例如以其他不同类型的DCT 或DCT/DST的组合为基础的改进的离散余弦变换。

在MP3的应用上,改进的离散余弦变换,并不适用于直接处理音频信号,而适用于处理32波段多相正交滤波器(Polyphase quadrature filter, PQF )阵列的输出端信号。这样的改进的离散余弦变换输出是由一个混叠削减公式作后置处理,用以减少多相正交滤波器阵列的特殊混叠。这样的改进的离散余弦变换与滤波器阵列组合,被称作混合滤波器阵列或子带改进的离散余弦变换 。相反地,AAC 通常使用一个纯粹的改进的离散余弦变换;

仅Sony 公司使用的MPEG – 4 AAC - SSR技术采用了运用改进的离散余弦变换的四波段多相正交滤波器阵列(但也是很少使用)。自适应听觉变换编码(Adaptive TRansfeorm Acoustic Coding, ATRAC)利用运用改进的离散余弦变换的堆叠型正交镜像滤波器(Quadrature Mirror Filter, QMF )。

编辑本段基本介绍

最常用的一种离散余弦变换的类型是下面给出的第二种类型,通常我们所说的离散余弦变换指的就是这种。它的逆,也就是下面给出的第三种类型,通常相应的被称为" 反离散余弦变换" ," 逆离散余弦变换" 或者" IDCT " 。

有两个相关的变换,一个是离散正弦变换(DST for Discrete Sine Transform), 它相当于一个长度大概是它两倍的实奇函数的离散傅里叶变换;另一个是改进的离散余弦变换(MDCT for Modified Discrete Cosine Transform), 它相当于对交叠的数据进行离散余弦变换。

编辑本段主要应用

离散余弦变换,尤其是它的第二种类型,经常被信号处理和图像处理使用,用于对信号和图像(包括静止图像和运动图像) 进行有损数据压缩。这是由于离散余弦变换具有很强的" 能量集中" 特性:大多数的自然信号(包括声音和图像) 的能量都集中在离散余弦变换后的低频部分,而且当信号具有接近马尔科夫过程(Markov processes)的统计特性时,离散余弦变换的去相关性接近于K-L 变换(Karhunen-Loève 变换--它具有最优的去相关性) 的性能。

例如,在静止图像编码标准JPEG 中,在运动图像编码标准MJPEG 和MPEG 的各个标准中都使用了离散余弦变换。在这些标准制中都使用了二维的第二种类型离散余弦变换,并将结果进行量化之后进行熵编码。这时对应第二种类型离散余弦变换中的n 通常是8,并用该公式对每个8x8块的每行进行变换,然后每列进行变换。得到的是一个8x8的变换系数矩阵。其中(0,0)位置的元素就是直流分量,矩阵中的其他元素根据其位置表示不同频率的交流分类。

一个类似的变换, 改进的离散余弦变换被用在高级音频编码(AAC for Advanced Audio Coding),Vorbis 和 MP3 音频压缩当中。

离散余弦变换也经常被用来使用谱方法来接偏微分方程,这时候离散余弦变换的不同的变量对应着数组两端不同的奇/偶边界条件。 编辑本段计算方式

尽管直接使用公式进行变换需要进行O(n2)次操作,但是和快速傅里叶变换类似,我们有复杂度为O(nlog(n))的快速算法,这就是常常被称做蝶形变换的一种分解算法。另外一种方法是通过快速傅里叶变换来计算DCT ,这时候需要O(n)的预操作和后操作。

编辑本段参考资料

K. R. Rao and P. Yip, 离散余弦变换 : 算法、优点和应用 (Discrete Cosine Transform: Algorithms, Advantages, Applications) (Academic Press, Boston, 1990).

A. V. Oppenheim, R. W. Schafer, and J. R. Buck, 时间离散信号处理 (Discrete-Time Signal Processing), second edition

(Prentice-Hall, New Jersey, 1999).

S. A. Martucci, 对称卷积和离散正弦余弦变换 (Symmetric

convolution and the discrete sine and cosine transforms), IEEE Trans. Sig. ProcessingSP-42, 1038-1051 (1994).

Matteo Frigo and Steven G. Johnson: FFTW, http://www.fftw.org/. 一个免费的C 语言库GPL ,可以计算DCT-I~IV的1维到多维的任意大小的变换

M. Frigo and S. G. Johnson, "FFTW3的设计和实现," Proceedings of the IEEE93 (2), 216–231 (2005).

编辑本段改进的离散余弦变换

改进的离散余弦变换(Modified Discrete Cosine Transform, MDCT)是一种与傅立叶变换相关的变换,以第四型离散余弦变换(DCT-IV )为基础,重叠性质如下:它是应用于处理较大的资料集合,当连续的资料区块中,当前的资料区块跟后续的资料区块有重叠到的情形;即当前资料区块的后半段与下一个资料区块的前半段为重叠的状态。这样的重叠情形,除了具有离散余弦变换(Discrete Cosine Transform, DCT)的能量压缩特性外,也使这种变换在应用于信号压缩时更引人注目。因为它有助于避免由于资料区块边界所产生的多余资料。因此,这种变换可应用于MP3,AC-3, ogg vorbis,和AAC 的音频压缩等方面。

改进的离散余弦变换是由Princen ,Johnson 和Bradley 承接早前(1986年)Princen 和Bradley 所提出关于时域混叠消除法(Time-Domain Aliasing Cancellation, TDAC )的改进的离散余弦变换基本定理,于1987年所提出,详述如下。至于其他类似的变换还有如以离散正弦变换为基础的改进的离散正弦变换(Modified Discrete Sine Transform, MDST)。以及其他较少使用的变换,例如以其他不同类型的DCT 或DCT/DST的组合为基础的改进的离散余弦变换。

在MP3的应用上,改进的离散余弦变换,并不适用于直接处理音频信号,而适用于处理32波段多相正交滤波器(Polyphase quadrature filter, PQF )阵列的输出端信号。这样的改进的离散余弦变换输出是由一个混叠削减公式作后置处理,用以减少多相正交滤波器阵列的特殊混叠。这样的改进的离散余弦变换与滤波器阵列组合,被称作混合滤波器阵列或子带改进的离散余弦变换 。相反地,AAC 通常使用一个纯粹的改进的离散余弦变换;

仅Sony 公司使用的MPEG – 4 AAC - SSR技术采用了运用改进的离散余弦变换的四波段多相正交滤波器阵列(但也是很少使用)。自适应听觉变换编码(Adaptive TRansfeorm Acoustic Coding, ATRAC)利用运用改进的离散余弦变换的堆叠型正交镜像滤波器(Quadrature Mirror Filter, QMF )。


相关内容

  • 深刻理解傅里叶变换
  • 要理解傅立叶变换,确实需要一定的耐心,别一下子想着傅立叶变换是怎么变换的,当然,也需要定的高等数学基础,最基本的是级数变换,其中傅立叶级数变换是傅立叶变换的基础公式. 一.傅立叶变换的提出 让我们先看看为什么会有傅立叶变换?傅立叶是一位法国数学家和物理学家的名字,英语原名是Jean Baptiste ...

  • 引导学生理解信号频谱的概念和意义
  • 第26卷 第5期 2007年10月理 工 高 教 研 究Journal of T echnology College Education Vol. 26 No. 5 Octember 2007 引导学生理解信号频谱的概念和意义 国防科学技术大学 刘芸 李宗伯 刘芳 摘要: 针对教学难点, 就如何引导 ...

  • 傅立叶变换的原理.意义和应用
  • 傅立叶变换的原理.意义和应用 1概念:编辑 傅里叶变换是一种分析信号的方法,它可分析信号的成分,也可用这些成分合成信号.许多波形可作为信号的成分,比如正弦波.方波.锯齿波等,傅里叶变换用正弦波作为信号的成分. 参考<数字信号处理>杨毅明著p.89,机械工业出版社2012年发行. 定义 f ...

  • MATLAB在信号频谱分析中的应用
  • 摘要:利用matlab 对信号频谱进行分析,通过两种方法将频谱横轴的快速傅里叶变换点数转换成频率.以常见信号频谱分析为例,将结果以图形化的方式显示出来.通过matlab 仿真,使以往抽象的内容具体化. 关键词:频谱分析:matlab :快速傅里叶变换:仿真 中图分类号:tn911.6 文献标识码:a ...

  • 福建省厦门市高中数学教材人教A版目录(详细版)
  • 考试范围: 文科: 必考内容:必修①②③④⑤+选修1-1,1-2 选考内容:无选考内容 理科: 必考内容:必修①②③④⑤+选修2-1,2-2,2-3 选考内容(三选二):选修4-2,4-4,4-5 文.理科必考内容: 数学①必修 第一章 集合与函数概念 1.1 集合 1.1.1 集合的含义与表示 1 ...

  • 图像压缩编码
  • 图像压缩编码 物电学院 114班 11223313 戚善桃 摘要:随着科学技术的发展, 图像压缩技术越来越引起人们的关注.为此从众多的图像压缩编码标准中选取了基于DCT 变换的JPEG 图像压缩编码算法进行研究,并通过对比分析各种软件特性选取了MATLAB 进行实验仿真. 首先说明了图像压缩在现代通 ...

  • 多媒体技术基础与应用简答论述题
  • 多媒体技术基础与应用简答论述题 1-7 7.简述多媒体计算机的关键技术及其主要应用领域? 答:多媒体计算机的关键技术是:(1)视频音频信号获取技术:(2)多媒体数据压缩编码和解码技术: (3)视频音频数据的实时处理和特技:(4)视频音频数据的输出技术. 多媒体技术促进了通信.娱乐和计算机的融合.多媒 ...

  • 常见信号的傅里叶变化
  • 题目: 用MATLAB对常见信号的Fourier变换分析 姓 名:学 号:专 业:电子信息科学与技术年 级:院 系:完成日期:指导教师: 王聪 [1**********]6 2006级 物理与电子工程学院 2010年5月 潘孟美 本科生毕业论文(设计)独创性声明 本人声明所呈交的毕业论文(设计)是本 ...

  • 人教版高中数学教材最新目录
  • 人教版普通高中课程标准实验教科书 数学 1.3 算法案例 必修一 第一章 集合与函数概念 1.1 集合 1.2 函数及其表示 1.3 函数的基本性质 第二章 基本初等函数(Ⅰ) 2.1 指数函数 2.2 对数函数 2.3 幂函数 第三章 函数的应用 3.1 函数与方程 3.2 函数模型及其应用 第二 ...