颜色,形状,纹理特征
FROM:http://blog.sina.com.cn/s/blog_661159d50100kij7.html
References
1.???????MPEG-7 overview(http://mpeg.chiariglione.org/standards/mpeg-7/mpeg-7.htm)
2.???????孫君頂,趙珊。?圖像低層特征提取與檢索技術
?
?
1.?MPEG-7中圖像特征描述符標準
1.1 MPEG-7標準中的幾個重要概念:
描述符(Descriptors, Ds),描述方案(Description Schemes, DS),描述定義語言(Description Definition Language, DDL)
Ds:表示多媒體特征信息的語法和語義屬性,一個特征可以用多個描述符來表示。比如,可以用平均色,主色,顏色直方圖等來描述顏色特征。
DS:指定了對象或者特征的結構和關系,一般情況下,描述方案是解決圖像分類和組織問題,或以特定的索引結構描述圖像內(nèi)容的子系統(tǒng)。
DDL:目前,MPEG-7采用特定擴展的XML語言作為描述定義語言。
1.2 MPEG-7標準涉及五類基本的視覺特征,對應的使用了5類描述符:顏色描述符,紋理描述符,形狀描述符,運動描述符和位置描述符。其中顏色,紋理,形狀描述符針對單幅靜止圖像
1.2.1?顏色描述符
顏色描述符涉及顏色空間描述符(Color Space Descriptor),顏色量化描述符(Color Quantization Descriptor),主顏色描述符(Dominant Color Descriptor),可伸縮顏色描述符(Scalable Color Descriptor),顏色布局描述符(Color Layout Descriptor),顏色結構描述符(Color Structure Descriptor)及幀圖/圖組顏色描述符(Group of Frames/Group of Pictures Color Descriptor)等
顏色空間描述符描述了MPEG-7顏色描述符的顏色空間,包括RGB,YCbCr,HMMD,HSV,以及各種顏色系統(tǒng)與RGB的線性變換矩陣。
顏色量化描述符描述了顏色空間的均勻量化,量化產(chǎn)生的維(Bin)的數(shù)目是可匹配置的,這樣使得各種應用具有更大的靈活性。該描述符往往需要和主顏色等描述符配合。
主顏色描述符最適用于表示局部(對象或圖像區(qū)域)特征,幾種顏色就足以表達我們剛興起的區(qū)域的信息。
可伸縮顏色描述符定義了HSV空間的顏色直方圖,然后用Haar變化編碼。根據(jù)Bin的數(shù)目和Bit表示的精度,它的二進制表達在Bin的數(shù)量和Bit表達精度上都是可伸縮的。這個描述符主要用于圖像與圖像的匹配和基于顏色特征的檢索,檢索的精度隨著描述中使用的比特數(shù)目的增加而增加。
顏色布局描述符描述了整幅圖像或者圖像的部分區(qū)域的顏色空間分布狀況。
顏色結構描述符是一個顏色特征描述符,它既包括顏色內(nèi)容信息,又包括內(nèi)容的結構信息。他的主要功能是圖像與圖像的匹配,主要用于靜態(tài)圖像檢索。
幀圖/圖組顏色描述符用于靜態(tài)圖像的可伸縮顏色描述符擴展到對視頻片段或靜態(tài)圖像集合的顏色描述。在Haar變換之前,用附加的倆個比特定義如何計算顏色直方圖:是均值,中值還是相交。
?
1.2.2?形狀描述符
形狀描述符涉及區(qū)域形狀描述符(Region Shape Descriptor),輪廓形狀描述符(Contour Shape Descriptor),及3D形狀描述符(Shape 3D)三種
?
Figure 1: Example of various shapes
區(qū)域形狀描述符的表達式是由一系列ART(Angular Radial Transform)系數(shù)構成的。ART定義了一組二維的復值正交基函數(shù),將二維區(qū)域投射到這些函數(shù)上,得到的系數(shù)歸一化后就可以描述區(qū)域的形狀并用于匹配。
輪廓形狀描述符是利用輪廓的多尺度曲率克難攻堅(Curvature Scale Space, CSS)來描述封閉的輪廓。
三維形狀描述符可用于想對自然的或虛擬的三維目標。
1.2.3?紋理描述符
紋理描述符涉及同質(zhì)紋理描述符(Homogenous Texture Descriptors),紋理瀏覽描述符(Texture Browsing Descriptors)和邊緣直方圖描述符(Edge Histogram Descriptors)三種。
同質(zhì)紋理描述符在紋理具有一致性的區(qū)域統(tǒng)計紋理的空間頻率,它作為一個重要的視覺特征,通過頻域計算能力和能量差來提供對紋理的量化描述。同質(zhì)紋理描述子采用了5個尺度和6個方向的30個Gabor濾波器對紋理圖像進行多分辨率分解,將頻域內(nèi)濾波器組輸出能量的均值和標準差作為紋理特征。
紋理瀏覽描述符從類似于人類感知的角度和紋理的方向性(Directionality),規(guī)則性(Regularity)和粗糙程度(Coarseness)進行描述,適用于圖像的瀏覽和根據(jù)紋理粗糙程度進行的分類。
邊緣直方圖描述符描述了邊緣的空間分布信息。首先將圖像劃分成16個互不重疊的舉行區(qū)域,對每個圖像區(qū)域分布按水平,垂直,45°,135°四個方向和一個無方向性邊緣五類信息(如Figure 2)進行統(tǒng)計,此描述子具有尺度不變性,支持紋理旋轉(zhuǎn)和旋轉(zhuǎn)不變匹配,適用于非一致紋理圖像,如普通圖像的檢索。
?
Figure 2: Edge Definition
總結
以上是生活随笔為你收集整理的颜色,形状,纹理特征的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

- 上一篇: 计算机视觉目标检测的框架与过程
- 下一篇: 颜色特征