数字图像处理:第二十二章 基于模型的编码
第二十二章基于模型的編碼
目錄
作業(yè)
1. 引言
為了獲得更高的壓縮效率并保持一定的視頻質(zhì)量以支持超低碼率(大約10kbps)雙向視頻應(yīng)用,不考慮內(nèi)容特點的僅僅針對幀內(nèi)和幀間冗余的通用壓縮算法難以勝任。此外為了拓展數(shù)字視頻的應(yīng)用,具有內(nèi)容檢索功能的交互式視頻越來越重要,這需要在編碼的過程中加以考慮。目前正在制定的MPEG-4和MPEG-7壓縮標(biāo)準(zhǔn)就是迎合這種需要產(chǎn)生的,它的核心是一種新的基于結(jié)構(gòu)化模型的壓縮方法即基于模型的分析-綜合編碼技術(shù)[1]。
2. 基于對象的編碼
基于對象的編碼是將圖象中的物體分割出來作為視頻對象,以視頻對象為單位進行編碼。例如,目前MPEG-4中的視頻對象包括:自然視頻對象、Sprite對象、2D網(wǎng)格對象、3D人臉和身體對象、靜態(tài)的紋理對象、3D網(wǎng)格對象和音頻對象[2]。
基于對象編碼的原理圖如下圖所示。
例如,自然視頻對象分割:
3. 基于模型的編碼
基于模型的編碼可以看作是一種特殊的基于對象的編碼,此時對象的結(jié)構(gòu)更復(fù)雜,除了在對象的邊界存在形狀特征外,在對象的紋理區(qū)域也存在一定的結(jié)構(gòu),這些結(jié)構(gòu)信息通過網(wǎng)格模型的內(nèi)部節(jié)點和邊來表示[2]。
基于模型的編碼的原理圖如下所示:
3.1 2D網(wǎng)格模型
在MPEG-4中定義了兩類2D網(wǎng)格模型:
3.2 Sprite編碼技術(shù)
Sprite編碼技術(shù)是針對背景對象的特點提出的。通常情況下背景對象自身沒有任何運動,由于攝象機的運動而造成圖象序列中的背景變化,通過圖象的鑲嵌技術(shù)把整個序列的背景圖象拼接成一個大的完全的背景圖象,這個圖象就叫Sprite圖象[2]。
Sprite編碼技術(shù)是指首先對Sprite圖象編碼并傳輸一次并存儲在解碼端,在隨后的圖象只需要傳輸攝象機的運動參數(shù),就可以從Sprite上恢復(fù)所有的背景。
Sprite編碼分為靜態(tài)Sprite編碼和動態(tài)Sprite編碼,靜態(tài)Sprite圖象在編碼前生成,動態(tài)Sprite圖象在編碼過程中生成。
Sprite編碼效率高,主要面向視頻會議和視頻電話等場景固定的應(yīng)用中,這時可以將背景的全景圖事先傳輸過去并保存在解碼端。
Sprite編碼技術(shù)的原理如下圖所示:
參考文獻
致謝
我要感謝清華大學(xué)計算機系的博士研究生賀玉文同學(xué),本章內(nèi)容是根據(jù)他的學(xué)術(shù)報告編輯的,內(nèi)容和圖片取自:賀玉文,MPEG-4, MPEG-7簡介。
作業(yè)
返回主目錄返回本章目錄
清華大學(xué)計算機系 艾海舟
最近修改時間:2000年4月15日
 出處:http://media.cs.tsinghua.edu.cn/~ahz/digitalimageprocess/CourseImageProcess.html
總結(jié)
以上是生活随笔為你收集整理的数字图像处理:第二十二章 基于模型的编码的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
                            
                        - 上一篇: 数字图像处理:第二十一章 视频压缩标准
 - 下一篇: 数字图像处理:第二十三章 基于内容的图象