纠缠不清的C语言位域(位段)详解
位域是什么?
有些數據在存儲時并不需要占用一個完整的字節,只需要占用一個或幾個二進制位即可。例如開關只有通電和斷電兩種狀態,用 0 和 1 表示足以,也就是用一個二進位。正是基于這種考慮,C語言又提供了一種叫做位域的數據結構。
在結構體定義時,我們可以指定某個成員變量所占用的二進制位數(Bit),這就是位域。請看下面的例子:
1struct?bs{ 2????unsigned?m; 3????unsigned?n:?4; 4????unsigned?char?ch:?6; 5};:后面的數字用來限定成員變量占用的位數。成員 m 沒有限制,根據數據類型即可推算出它占用 4 個字節(Byte)的內存。成員 n、ch 被:后面的數字限制,不能再根據數據類型計算長度,它們分別占用 4、6 位(Bit)的內存。
n、ch 的取值范圍非常有限,數據稍微大些就會發生溢出,請看下面的例子:
1#include?2int?main(){3????struct?bs{4????????unsigned?m;5????????unsigned?n:?4;6????????unsigned?char?ch:?6;7????}?a?=?{?0xad,?0xE,?'$'};8????//第一次輸出9????printf("%#x,?%#x,?%c\n",?a.m,?a.n,?a.ch); 10????//更改值后再次輸出 11????a.m?=?0xb8901c; 12????a.n?=?0x2d; 13????a.ch?=?'z'; 14????printf("%#x,?%#x,?%c\n",?a.m,?a.n,?a.ch); 15????system("pause"); 16????return?0; 17}運行結果:
對于 n 和 ch,第一次輸出的數據是完整的,第二次輸出的數據是殘缺的。
第一次輸出時,n、ch 的值分別是 0xE、0x24('$' 對應的 ASCII 碼為 0x24),換算成二進制是1110、10 0100,都沒有超出限定的位數,能夠正常輸出。
第二次輸出時,n、ch 的值變為 0x2d、0x7a('z' 對應的 ASCII 碼為 0x7a),換算成二進制分別是?10 1101、111 1010,都超出了限定的位數。超出部分被直接截去,剩下?1101、11 1010,換算成十六進制為 0xd、0x3a(0x3a 對應的字符是 :)。
C語言標準規定,位域的寬度不能超過它所依附的數據類型的長度。通俗地講,成員變量都是有類型的,這個類型限制了成員變量的最大長度,:后面的數字不能超過這個長度。
例如上面的 bs,n 的類型是 unsigned int,長度為 4 個字節,共計 32 位,那么 n 后面的數字就不能超過 32;ch 的類型是 unsigned char,長度為 1 個字節,共計 8 位,那么 ch 后面的數字就不能超過 8。
我們可以這樣認為,位域技術就是在成員變量所占用的內存中選出一部分位寬來存儲數據。
C語言標準還規定,只有有限的幾種數據類型可以用于位域。在 ANSI C 中,這幾種數據類型是 int、signed int 和 unsigned int(int 默認就是 signed int);到了 C99,_Bool 也被支持了。
但編譯器在具體實現時都進行了擴展,額外支持了 char、signed char、unsigned char 以及 enum 類型,所以上面的代碼雖然不符合C語言標準,但它依然能夠被編譯器支持。
位域的存儲
C語言標準并沒有規定位域的具體存儲方式,不同的編譯器有不同的實現,但它們都盡量壓縮存儲空間。
位域的具體存儲規則如下:
當相鄰成員的類型相同時,如果它們的位寬之和小于類型的 sizeof 大小,那么后面的成員緊鄰前一個成員存儲,直到不能容納為止;如果它們的位寬之和大于類型的 sizeof 大小,那么后面的成員將從新的存儲單元開始,其偏移量為類型大小的整數倍。
以下面的位域 bs 為例:
1#include?2int?main(){3????struct?bs{4????????unsigned?m:?6;5????????unsigned?n:?12;6????????unsigned?p:?4;7????};8????printf("%d\n",?sizeof(struct?bs));9????return?0; 10}運行結果:
m、n、p 的類型都是 unsigned int,sizeof 的結果為 4 個字節(Byte),也即 32 個位(Bit)。m、n、p 的位寬之和為6 12 4 = 22,小于 32,所以它們會挨著存儲,中間沒有縫隙。
sizeof(struct bs)的大小之所以為 4,而不是 3,是因為要將內存對齊到 4 個字節,以便提高存取效率。
如果將成員 m 的位寬改為 22,那么輸出結果將會是 8,因為22 12 = 34,大于 32,n 會從新的位置開始存儲,相對 m 的偏移量是?sizeof(unsigned int),也即 4 個字節。
如果再將成員 p 的位寬也改為 22,那么輸出結果將會是 12,三個成員都不會挨著存儲。
當相鄰成員的類型不同時,不同的編譯器有不同的實現方案,GCC 會壓縮存儲,而VC/VS 不會。
請看下面的位域 bs:
1#include?2int?main(){3????struct?bs{4????????unsigned?m:?12;5????????unsigned?char?ch:?4;6????????unsigned?p:?4;7????};8????printf("%d\n",?sizeof(struct?bs));9????return?0; 10}在 GCC 下的運行結果為 4,三個成員挨著存儲;在 VC/VS 下的運行結果為 12,三個成員按照各自的類型存儲(與不指定位寬時的存儲方式相同)。
m 、ch、p 的長度分別是 4、1、4 個字節,共計占用 9 個字節內存,為什么在 VC/VS 下的輸出結果卻是 12 呢?期待您的回復。
如果成員之間穿插著非位域成員,那么不會進行壓縮。例如對于下面的 bs:
在各個編譯器下 sizeof 的結果都是 12。
通過上面的分析,我們發現位域成員往往不占用完整的字節,有時候也不處于字節的開頭位置,因此使用&獲取位域成員的地址是沒有意義的,C語言也禁止這樣做。地址是字節(Byte)的編號,而不是位(Bit)的編號。
聲明:
本文于網絡整理,版權歸原作者所有,如來源信息有誤或侵犯權益,請聯系我們刪除或授權事宜。
總結
以上是生活随笔為你收集整理的纠缠不清的C语言位域(位段)详解的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 外网怎么访问局域网如何访问局域网其他路由
- 下一篇: 猪睾丸怎么做好吃 猪睾丸如何做好吃
