Wyner-Ziv视频编码的解码算法改进--专业论文--论文--机器视觉网

摘要:首先简要介绍了一种典型的分布式视频编码－Wyner-Ziv视频编码。然后对Wyner-Ziv视频编码中边信息进行理论上的分析，随后给出了基于加权MAD准则的边信息估计算法和基于Huber-Markov随机场先验概率约束的联合解码算法。实验仿真结果表明，采用本文解码优化策略在相同输出码率时，PSNR比原始算法平均提高1.5dB。

关键词:分布式视频编码； Wyner-Ziv视频编码；边信息；运动估计

1 引言

随着多媒体通信技术的发展，新的视频应用需求不断涌现，如：无线视频监控、无线PC相机、移动视频电话、多媒体传感器网络等。在这些视频应用中，无线视频终端往往需要低复杂度的编码器，所以计算能力、内存容量、耗电量都受限制。传统视频编码系统（如H.26x，MPEG）普遍采用混合编码框架，编码运用运动估计，充分挖掘视频信号的冗余信息，通常情况下，编码复杂度是解码复杂度的5－10倍，在这些新的视频应用场合中，传统视频编码技术面临着挑战。目前一种全新的视频编码框架——分布式视频编码（DVC：Distributed Video Coding）[1][2]开始受到关注，这种视频编码具有编码简单，解码较复杂，并且能够实现较为高效的压缩，编码鲁棒性好的特点。分布式视频编码的思想最早分别由Slepian和Wolf，Wyner和Ziv以信息编码理论的方式提出，并且加以论证，而分布式视频编码的具体实现算法从2002年开始有学者进行相关问题的研究，并逐渐引起关注，成为视频编码领域的关注较多的前沿课题之一[3]。

分布式视频编码在编码端，把各帧图像看成“独立信源”，各帧之间进行独立编码，编码方式类似于传统的帧内编码。在解码端，利用时域相邻帧的高度相关性，对已解码重建帧运动估计，通过时域内插计算边信息，最后边信息用于Slepian-Wolf解码和当前解码帧的重构。目前主要典型的算法有：Bernd Girod等提出的Wyner-Ziv视频编码 [1][4][5]；Ramchandran等提出的PRISM （Power-efficient Robust high-compression Syndrome-base Multimedia）视频编码[6][7]。由于在分布式视频编码系统中的解码端，需要运动估计开发时域相邻帧的相关信息，所以系统中编码器可以较为简单，把计算量较大的帧间预测（如运动估计）转移到解码端。在这些分布式视频编码中研究关注较多的是Wyner-Ziv视频编码[1][4]，其中如何获取边信息（side information）和联合解码需要解决的难点问题之一。本文对Wyner-Ziv视频编码中边信息进行较为详细的理论分析，然后提出了基于加权MAD准则的边信息估计算法和基于Huber-Markov随机场先验概率约束的联合解码算法。实验结果表明，本文的优化策略能够取得更好的编码效果。

2 Wyner-Ziv视频编码[1][4]

Wyner-ziv视频编码框图如图1所示，编码端采用了两种编码方式：一种是Wyner-ziv帧，图像信号均匀量化后，进行基于turbo码的Slepian-Wolf编码，其目的是保持视频信号的基本轮廓；另一种编码采用的是传统视频编码中的帧内编码（如H.263的帧内编码）作为关键帧（Key Frame）。

Wyner-Ziv编解码框架中，解码比较复杂的，其解码步骤如下：

Step1：对已解码的关键帧k之间通过运动估计，得到运动矢量，进行时域插值，计算边信息；

Step2：turbo解码器利用边信息联合解码出；

Step3：和利用最大后验估计（MAP：maximum a posteriori）联合重构Wyner-Ziv帧。

可见，在Wyner-Ziv视频编码中，其编码仅仅是传统帧内编码或者基于turbo码的Wyner-Ziv编码，所以编码复杂度和传统帧内编码相当；而解码较为复杂，通过帧内解码、turbo解码、运动估计、插值、和最大后验估计等进行联合解码，从而获得了较好的压缩效率。

3 Wyner-Ziv视频编码中边信息的有效性分析

设向量，其中x，y表示像素的位置。令当前解码帧为，是关键帧，是解码端重建的关键帧数据。解码端，通过对已解码的关键帧之间进行运动估计，得到运动矢量，由此可以估计出关键帧和当前帧之间的运动矢量场，求得边信息，如式（1）：

4 改进的Wyner-Ziv视频编码的解码方案

4.1边信息估计的改进算法

从上文的分析，可以看出在Wyner-Ziv视频编码中，压缩效率主要来自于解码端对边信息的估计。在Wyner-Ziv视频编码中运动估计和传统的视频编码中的运动估计有两个主要的区别。（1）运动估计在整个视频系统中的位置不同：传统视频编码中，运动估计在编码端进行，在当前帧（原始数据）和已解码重建帧之间计算运动矢量；而在Wyner-Ziv视频编码中的运动估计是在解码端进行的，在解码的重建帧之间计算运动矢量。（2）运动估计的计算准则不同：在传统的视频编码中，基于块的运动估计的主要计算准则是寻找最小MAD（mean absolute difference），以至于到达最佳的压缩效果，所以计算出的运动矢量和真实的运动矢量不一定相同；在Wyner-Ziv视频编码中，估计的运动矢量和真实的运动矢量的贴近程度和压缩效果紧密相关。

改进的Wyner-Ziv视频解码框架如图2所示，解码过程如下

Step1：利用解码重建帧之间进行运动估计，进行时域内插，估计边信息，Turbo解码器利用边信息进行Log-MAP译码；

Step2：当前Wyner-Ziv帧的经过反量化之后，和以前解码重建帧进行运动估计，计算边信息；

Step3：利用边信息和当前Wyner-Ziv帧信息，联合解码重构Wyner-Ziv帧。

为100帧，H.263的编码器采用TMN8[13]。实验结果如图6、图7所示，可以看出Wyner-Ziv视频算法[4]比H.263的帧内编码效率平均高1.7dB以上，同时编码端的复杂度要小于H.263的帧内编码。而采用MAD准则的运动估计解码算法比Wyner-Ziv视频编码算法[4]的编码效率平均高0.8dB，如果采用加权MAD准则的运动估计解码算法比Wyner-Ziv视频视频编码算法[4]的编码效率平均高1.5dB，同时解码图像主观质量也有所提高。

图5所示的是码流在500kbps时，Foreman序列第6帧的运动通过估计计算的边信息的主观比较图，其中图6（a）、（b）分别是解码端的第5帧和第9帧的解码重建图像（均为关键帧），图（c）、（d）分别是使用MAD准则和加权MAD准则通过运动估计获得的运动矢量场示意图，图（d）、（e）是分别使用MAD准则和加权MAD准则的运动估计获得的第6帧边信息（即对第6帧的运动补偿时域内插）的主观示意图。可以看出在运动估计中，采用加权的MAD准则，运动矢量场更加平滑，获得的边信息也更为准确。总体来说，本文算法是相当有效的，并且没有增加编码器的额外开销，而是在解码端充分得挖掘统计信息，从而获得了更好的压缩效果。

5 结　论

分布式视频编码的特点是编码简单，解码复杂；压缩效率高；抗误码性能好；易于分级和多描述处理，因而这种编码方式非常适合于耗电低、存储容量小、运算速度有限的无线视频终端，具有较大的应用前景，因此逐渐成为视频编码研究领域的前沿课题。Wyner-Ziv视频编码是一种典型的分布式视频编码实现方案。本文Wyner-Ziv视频编码中边信息进行较为详细的理论分析，然后从边信息的获取、联合重构解码等两个方面对原始编解码算法加以改进。实验结果表明，采用本文的改进算法不增加编码复杂度，在相同输出码率下，编码信噪比PSNR比原始算法平均提高1.5dB，并且具有更好的主观效果。

参考文献

[1] Z. Xiong, Angelos D. Liveri, Samuel Cheng. Distributed source coding for sensor networks[J]. Signal Processing Magazine, IEEE Volume 21, Issue 5, Sept. 2004 Page(s):80 – 94.

[2] B. Girod, A. Aaron., S. Rane, D. Rebollo-Monedero. Distributed video coding[J]. Proceedings of the IEEE Volume 93, Issue 1, Jan. 2005 pp:71 – 83

[3] Catarina Brites, Fernando Pereira. Distributed Video Coding: Bringing New Applications to Life[EB/OL]

http://amalia.img.lx.it.pt/~cicb/conftele2005_final.pdf

[4] A. Aaron, R. Zhang, B. Girod. Wyner–Ziv coding of motion video[C]. the Asilomar Conf. Signals and Systems, Pacific Grove, CA, 2002.

[5] A. Aaron, S. Rane, R. Zhang, B. Girod. Wyner–Ziv coding for video: applications to compression and error resilience[C]. Proc. IEEE Data Compression Conf., 2003, pp. 93–102.

[6] R. Puri ,K. Ramchandran. PRISM: A Video Coding Paradigm Based on Motion-Compensated Prediction at the Decoder. [EB/OL]. http://www.eecs. berkeley.edu/~rpuri/researchlinks/papers/purirvc2003. pdf. gz

[7] R. Puri ,K. Ramchandran. PRISM: A ‘reversed’ multimedia coding paradigm[C]. IEEE Int. Conf. Image Processing, Barcelona, Spain, 2003.

[8] Maekus Flierl, Bernd Girod. Video coding with superimposed motion-compensated motion-compensated signals: application to H.264 and beyond [M]. Kluwer Academic Publishers, 2004

[9] Li Zhen , E.J. Delp. Wyner-Ziv video side estimator: conventional motion search methods revisited [C]. Image Processing, 2005. ICIP 2005. IEEE International Conference on Volume 1, 11-14 Sept. 2005 Page(s):I - 825-8

[10] B. Girod. Efficiency analysis of multihypothesis motion-compensated prediction for video coding[J]. IEEE Transactions on Image Processing, Volume 9, Issue 2, Feb. 2000 Page(s):173 – 183

[11] H. Taehyeun, L.Seongjoo, K. Jaeseok. Motion compensated frame interpolation by new block-based motion estimation algorithm [J].IEEE Transactions on Consumer Electronics, Volume 50, Issue 2, May 2004 Page(s):752 – 759

[12] Gan Zong liang, Zhu Xiu-chang. A Novel Improved Method of Pixel-Domain Wyner-Ziv Video Coding [C]. Picture Coding Symposium (PCS) 2006. Beijing

[13] Video Codec Test Model. ITU-T/SG15, TMN8, Portland, OR, June 1997