多媒体之旅——从MPEG1到MPEG7_平安城市建设安防优秀工程企业推荐--中国安防行业网


首页 \| 活动介绍 \| 报名参加 \| 企业风采 \| 相关报道 \| 往届回顾

发展历程

多媒体之旅——从MPEG1到MPEG7

       MPEG是国际标准化组织和国际电工委员会第一联合技术组（ISO/IEC JTC1）1988年成立的运动图像专家组（Moving Picture Expert Group）的简称，全称为ISO/IEC JTC1第29分委会第11工作组（ISO/IEC JTC1/SC29/WG11），负责数字视频、音频和其他媒体的压缩、解压缩、处理和表示等国际技术标准的制定工作。从1988年开始，MPEG专家组每年召开四次左右的国际会议，主要内容是制定、修订、发展MPEG系列多媒体标准。视音频编码标准MPEG-1(1992)和MPEG-2(1994)、基于视听媒体对象的多媒体编码标准MPEG-4(1999年)、多媒体内容描述标准MPEG-7(2001)、多媒体框架标准MPEG-21。目前，MPEG系列国际标准已经成为影响最大的多媒体技术标准，对数字电视、视听消费电子产品、多媒体通信等信息产业的重要产品产生了深远影响。

     一、运动图像的压缩

     数字影像的出现，得益于两项技术的发展：光碟存储技术和影像数字压缩技术。比如，NTSC制式的电视图像以大约640×480的分辨率、24bits／像素、每秒30帧的质量传输时，其数据传输率达28Mbit／s，20秒的未压缩视频图像将占用560Mbit的存储空间，相当于一张CD－ROM光盘只能储存20秒钟的未压缩电视节目。显然这样的要求对普通个人用户来讲是难以接受的，在实现上成本也是非常高昂。所以，视频图像的压缩编码方法 MPEG 就应运而生了。

     MPEG（即Moving Picture Experts Group运动图像专家小组）是个国际标准，即所谓ISO11172。MPEG的缔造者们原先打算开发四个版本：MPEG－1到MPEG－4，以适用于不同带宽和数字影像质量的要求，后来由于MPEG－3被放弃。总的来说，MPEG优于其他影像压缩缩方案的地方是：具有很好的兼容性、压缩比最高可达200:1、数据的损失小。

     二、MPEG－1

　　技术特点：MPEG－1制定于1992年，可适用于不同带宽的设备，如CD－ROM、Video－CD、CD－i。它的目的是把221Mbit／s的NTSC图像压缩到1.2Mbit／s，压缩率为200∶1。这是图像压缩的工业认可标准。它可针对SIF标准分辨率(对于NTSC制为352×240；对于PAL制为（352×288)的图像进行压缩，传输速率为1.5Mbits／s，每秒播放30帧，具有CD音质，质量级别基本与VHS（广播级录像带）相当。MPEG的编码速率最高可达4－5Mbits／s，但随着速率的提高，其解码后的图像质量有所降低。

　　应用范围：应用 MPEG－1 技术最成功的产品非 VCD 莫属了，VCD作为价格低廉的影像播放设备，得到广泛的应用和普及。MPEG－1也被用于数字电话网络上的视频传输，如非对称数字用户线路(ADSL)，视频点播(VOD)，以及教育网络等。

　　三、MPEG－2

　　技术特点：MPEG－2制定于1994年，设计目标是高级工业标准的图像质量以及更高的传输率。MPEG－2所能提供的传输率在3MB－10MB／s间，在NTSC制式下的分辨率可达720×486，MPEG－2能够提供广播级的视像和CD级的音质。MPEG－2的音频编码可提供左右中及两个环绕声道,以及一个加重低音声道和多达七个伴音声道。MPEG－2的另一特点是，可提供一个较广范围的可变压缩比，以适应不同的画面质量、存储容量以及带宽的要求。

　　应用范围：MPEG－2技术就是实现DVD的标准技术，现在DVD播放器也开始在家庭中普及起来了。除了作为DVD的指定标准外，MPEG－2还可用于为广播、有线电视网、电缆网络以及卫星直播提供广播级的数字视频。

　　四、MPEG－3

　　由于MPEG－2的出色性能表现，已能适用于HDTV（高清晰度电视），使得原打算为HDTV设计的MPEG－3，还没出世就被抛弃了。

　　五、MPEG－4

　　曾制定出MPEG－1和MPEG－2视音频压缩标准的运动图像专家组（MPEG）目前正在发展最新的MPEG－4标准，其目标是提供未来的交互式多媒体应用。MPEG－4将制定出与以往不同的、具有高度灵活性和可扩展性的未来新一代国际标准。在音频标准的制定方面，比较以前的音频编码标准，MPEG－4增加了许多新的关于合成内容及场景描述等领域的工作，增加了诸如可分级性、音调变化、可编辑性及延迟等新功能。MPEG－4将以前发展良好但相互分离的高质量音频编码、计算机音乐及合成语音等第一次合成并在一起，在诸多领域内给予高度的灵活性。

     MPEG－4中关于音频信号将包括：传统的音频编码标准，即所谓“自然音频”（natural audio）和新颖的“结构音频”（structured audio）以及自然和合成混合在一起的“合成/自然混合编码”（Synthetic/natural hybrid coding）简称SNHC。其中SNHC是MPEG－4中关于音视频的一个很重要的概念。

　　1、传统的自然音频编码

　　一个基本的概念就是MPEG－4的编码工具不再仅限于支持码率的减少，其各种不同的工具支持从智能语音到高质量多声道音频信号，以及此范围内的音频信号的质量。MPEG－4编码工具支持的其他功能还有：

　　.速度的变化，允许不改变音调实现时间尺度变化；
　　.音调的变化，允许不改变时间尺度实现音调改变；
　　.码率的可分级性，对比特流的分解可在传输或解码器中进行；
　　.带宽的可分级性，代表部分频谱的比特流的一段可在传输或解码过程中被抛弃；
　　.编码器复杂度的可分级性；
　　.强纠错性等。

　　MPEG－4标准的自然音频编码将码率范围规定为每声道2kbit/s～64 kbit/s。在如此宽的范围内定义了三种类型的编码器或叫编码工具。在最低的码率范围2～6 kbit/s之间使用的是参数编码（parametric coding），最适合于采样率为8kHz的语言信号；在6～24 kbit/s的码率范围内使用的是编码激励的线型预测编码（code excited linear predictive coding）简称CELP，支持采样率为8kHz和16 kHz的语言和音频信号；在最高的16～64 kbit/s的码率范围内使用的是时间/频率编码（time/frequencycoding）技术，比如MPEG－2AAC标准，支持采样率为8～96 kHz的任意音频信号。

     1.1参数编码

　　参数编码提供了两种编码工具：HVXC和HILN。

　　谐音矢量激励编码HVXC（Harmonic Vector eXcitation Coding）编码工具允许对语言信号在2kbit/s和4kbit/s之间进行可分级性编码。HVXC的解码过程分四步进行：参数的反量化；对声音帧用正弦合成产生激励信号和加上噪声分量；对非声音帧通过查找码书产生激励信号；LPC（线型预测编码）合成。对合成语言质量的增强可以使用频谱后置滤波。

　　HVXC提供了在延迟模式上的可分级性。其编码器和解码器可以独立地选择低或正常的延迟模式。

　　谐音和独立线性加性噪声HILN（Harmonic and Individual Line plus Noise）编码工具允许对非语言信号，例如音乐以4kbit/s和更高的码率进行编码。HILN支持在速度、音调、码率和复杂度上的可分级性。其独立线性基础解码器从比特流中重建线性参数频率、幅度和包络。增强解码器使用更好的量化对上述参数进行重建，并且对线性参数相位也进行了重建。信号解码的速度可以仅通过改变帧长来实现，音调的改变通过在合成之前利用一个比例因子复合每一个频率参数来实现，而且无须改变帧长，也不会引起相位失真。增强解码器由于对相位进行重建而带来了诸多优点，使解码器输出的信号近似于编码器输入的波形。

　　可以将HVXC和HILN联合起来使用以获得更宽范围内的信号和码率。可以在两者编码器的输出之间动态地切换或混合。

     1.2CELP编码

　　CELP的解码器包括一个激励源、一个合成滤波器和一个需要时添加的后置滤波器。

　　激励源拥有两种分量，一是由自适应码书产生的周期分量，另一个是由一个或多个固定码书产生的随机分量。在解码器中，使用码书索引和增益索引来重建激励信号。激励信号接着通过线性预测合成滤波器，最后，为了获得增强的语言质量，可以使用后置滤波器。CELP支持两种采样率：8kHz和16kHz。

　　当采样率为8kHz时，码率的可分级性是通过不断加上所谓“增强层”（enhancement layer）来实现的。在基础码率上以2kbit/s的步长增加，可加的增强层的最大数目是三，意味着可在基础码率上加上2，4，6 kbit/s。当采样率为16kHz时，可以通过只使用比特流的一部分来解码语言信号，这就提供了在复杂度上的可分级性。还有一些其他支持复杂度可分级的方法，例如简化LPC、后置滤波器的使用与否等等。复杂度的可分级性依赖于实际的应用而与比特流的语法无关。而当解码器用软件实现时，复杂度甚至可以实时地予以改变，以利于在有限容量计算机接口或多任务环境下运行。

　　带宽的可分级性在采样率为8kHz和16kHz时均可实现，是通过在CELP编码上加一个带宽扩展工具来实现的。

     1.3时间/频率编码

　　当码率为每声道64kbit/s时就是MPEG－2AAC编码标准，此时可以获得极好的音频质量。MPEG－2AAC是MPEG－4时间/频率编码的核心。其滤波器的输出含有1024条或1280条频率线，通过块切换来获得不同的时间和频率分辨率。用时域噪声整形（TNS）来控制时域量化噪声的形状。通过在每一个频谱系数上使用后向自适应预测器来有效提高滤波器组的分辨率。频谱系数被划分为近似临界频带结构的所谓比例因子频带，每个比例因子频带共享一个比例因子使用一个非均匀量化器。编码器的心理声学模型控制量化的步阶将量化噪声置于信号阀值之下予以掩蔽。在无噪声编码工具下，<

上一篇： “数字音视频编解码技术标准工作组” （简称AVS工作组） 2008/11/7 10:34:00
下一篇：视频编码标准的发展：从H.261到H.264 2008/11/7 9:36:00

组织单位：

支持媒体：

　时间安排

2009年2月10日，完成材料报送
2009年2月10日-28日，完成评价工作
2009年3月，完成推荐工作

　推荐范围

　　本次推荐的对象主要为从事安防工程系统集成或设计、安装、维修的工程企业，推荐数量约为100-200家。

　联系方式

中国安全防范产品行业协会

地址：北京市海淀区阜成路28号
航医大厦713
邮　编：100037
联系人：张丽英
电话：010-68730588-26
传　真：010-51817901

中国安防行业网

地址：北京市宣武区广外大街南　　　　滨河路25号金工宏洋大厦A座203室　　　　
邮　编：100055
联系人：李琴
电话：010-63478617