首页 > 技术特点 > 正文
SVAC标准技术特点
    2014/11/24 14:26:00    关键字:SVAC,标准,技术特点      浏览量:
  1.SVAC标准的技术创新简介

  (1)支持高精度视频数据,在高动态范围场景提供更多图像细节,减少编解码环节的图像信息损失。

  (2)采用帧内4×4预测与变换、上下文自适应二进制算术编码(CABAC)等技术提高编码效率,在获得更好图像质量的同时也能获得更高的编码效率。

  (3)支持感兴趣区域(ROI)变质量编码,在网络带宽存储空间有限的情况下,提供更符合监控需要的高质量视频编码。

  (4)支持可伸缩视频编码(SVC),满足不同传输网络带宽和数据存储环境的需求。

  (5)支持代数码书激励线性预测(ACELP)和变换音频编码(TAC)切换的双核音频编码,保证对语音和环境(背景)声音均有较好的编码效果。

  (6)支持声音识别特征参数编码,避免编码失真对语音识别和声纹识别的影响。

  (7)支持监控专用信息(绝对时间、智能分析结果、报警信息),便于视音频内容的有效管理和综合利用。

  (8)支持加密和认证,保证监控数据的保密性、真实性和完整性。

  2.SVAC标准的技术特点详解

  (1)SVAC标准主要技术特点-支持高精度视频数据

  监控场景图像动态范围往往很大,低精度视频数据会导致图像对比度下降、图像细节和层次丢失,造成图像原始内容的损失;SVAC视频压缩编码支持高精度视频数据,可以保证视频编解码环节尽量少的损失图像信息,保证存储的视频数据尽可能真实、完整的保留拍摄场景的信息和图像细节,对后期的综合研判以及作为法律证据意义重大;按照SVAC标准中的量化方法,采用高精度视频数据不会降低编码效率,不会增加码率,采用10-bit数据同样码率下PSNR好于8-bit数据;标准的技术框架保留未来扩充至支持更高数据位宽(如16-bit)的可能。


  (2)SVAC标准主要技术特点-支持先进编码工具

  SVAC标准可以在获得更好图像质量的同时获得较高编码效率,一是采用CABAC获取更高编码效率,上下文自适应二进制算术编码。(CABAC)是一种先进高效的熵编码技术,大量研究结果表明,CABAC比VLC有更高的编码效率(减小码率约10%);二是采用Intra4x4以更好地保持图像细节,在采用8x8预测和变换的基础上,增加帧内4x4(Intra4x4)预测和变换,更好地保持图像细节,大量测试结果表明,采用Intra4x4可以有效降低细节丰富、边缘锐利区域附近的噪声。



  (3)SVAC标准主要技术特点-感兴趣区域(ROI)变质量编码

  监控应用中,通常总是对场景中的某些区域更关心--感兴趣区域(Regions of Interest : ROI);图像被分为若干个ROI区域和一个背景区域,在网络带宽或存储空间有限的情况下,优先保证ROI图像质量,节省非ROI的开销;每个ROI的图像质量分别控制,支持ROI部分比非ROI部分采用更高码率(图像质量更好);码率受限时,优先降低非ROI部分的码率,支持非ROI部分图像可丢弃或不编码,以适应传输带宽的要求。


  (4)可伸缩视频编码SVC

  可伸缩视频编码(Scalable Video Coding)通过对视频数据的分层次压缩(分为基本层和增强层),一个编码器可以输出不同分辨率/帧率/质量的多个编码视频流。SVC主要包括: 空间SVC(Spatial SVC)时间SVC(Temporal SVC)质量SVC(Quality SVC)。



  空间可伸缩视频编码SVC

  基本层由低分辨率编码图像构成,对基本层单独解码可以获得一个低分辨率的视频序列,对基本层和增强层联合解码可以获得高分辨率的视频序列,空间SVC比简单的双码流具有更低的总体码率。


  可伸缩视频编码SVC应用示例-更好的网络适应性

  SVC应用示例:更好的存储适应性


  (5)ACELP和TAC切换的双核音频编码

  低频信号采用ACELP和TAC双核编码,ACELP适合语音信号编码,TAC适合环境或背景声音编码。高频信号采用BWE编码利用低频解码信号和极少高频参数来重建高频信号,同全带编码技术相比,可以节省近50%码率。



  (6)声音识别特征参数编码

  在音频编码的基础上,支持识别特征参数编码,避免编码失真对语音/声纹识别的影响,识别特征参数采用MFCC方案,识别特征参数编码支持两种模式;直接编码模式:无需计算重建信号,直接编码原始信号特征矢量,计算复杂度低,码率4.8kbps。预测编码模式:原始信号和重建信号分别提取特征,编码特征残差矢量,计算复杂度高,码率3.2kbps。



  (7)支持监控专用信息

  绝对时间信息通过专门语法与视音频压缩数据一起传输和存储,便于检索查询、视音频同步和多路视频同步,还可以避免在图像上叠加OSD破坏图像原始内容;特殊监控事件类型及参数通过专门语法与视音频压缩数据一起传输和存储,便于检索查询,对于大规模监控网络和数据库更为重要。



  (8)支持监控数据加密和认证

  利用安全参数集定义加密和认证的方法及保护范围,可以实现不同级别保护;利用NAL单元头中特定标志位标记加密和认证是否生效;以统一的语法格式支持多种加密和认证算法,具备灵活的可扩展性。

  视频档次和级别的划分

  SVAC视频划分为简单、主要、高级3个档次(profile):简单档次支持帧模式编码、4:2:0数据采样格式、8-bit数据精度、帧内预测和前向预测(I/P-pic)、VLC编码、监控专用信息等,满足监控视频编解码的基础应用;主要档次增加支持场模式编码、4:0:0数据采样格式、9/10-bit数据精度、双向预测(B-pic)、CABAC编码、ROI、加密和认证等,满足典型监控应用的视频编解码需求;高级档次进一步增加支持4:2:2数据采样格式、SVC等, 功能更强大。

  SVAC视频主要根据图像分辨率、数据格式和最大编码比特率划分为8个级别(level)。

  音频档次和级别的划分

  SVAC音频划分为简单、主要、高级3个档次(profile):简单档次支持ACELP和BWE编码,可满足一般监控场景对语音信号的编码需求;主要档次增加支持识别特征参数的直接编码,实现复杂度有所增加;高级档次进一步增加支持TVC编码和识别特征参数的预测编码,实现复杂度高,但编码效率更高。

  SVAC音频主要根据采样频率划分为3个级别(level)。