《一个操作系统的实现》——pmtest1.asm详解
段機制輕松體驗?
內存尋址:?
實模式下的內存尋址:?
讓我們首先來回顧實模式下的尋址方式?
段首地址×16+偏移量 = 物理地址?
為什么要×16?因為在8086CPU中,地址線是20位,但寄存器是16位的,最高尋址64KB,它無法尋址到1M內存。于是,Intel設計了這種尋址 方式,先縮小4位成16位放入到段寄存器,用到時候,再將其擴大到20位,這也造成了段的首地址必須是16的倍數的限制。?
公式:xxxx:yyyy?
保護模式下分段機制的內存尋址:?
分段機制是利用一個稱作段選擇符的偏移量,從而到描述符表找到需要的段描述符,而這個段描述符中就存放著真正的段的物理首地址,再加上偏移量?
一段話,出現了三個新名詞:?
段選擇子?
描述符表?
段描述符?
================================??
我們現在可以這樣來理解這段話:?
有一個結構體類型,它有三個成員變量:?
段物理首地址?
段界限?
段屬性?
內存中,維護一個該結構體類型的數組。?
而分段機制就是利用一個索引,找到該數組對應的結構體,從而得到段的物理首地址,然后加上偏移量,得到真正的物理地址。?
公式:xxxx:yyyyyyyy?
其中,xxxx也就是索引,yyyyyyyy是偏移量(因為32位寄存器,所以8個16進制)xxxx存放在段寄存器中。?
================================?
現在,我們來到過來分析一下那三個新名詞:?
段描述符:一個結構體,它有三個成員變量:?
段物理首地址?
段界限?
段屬性?
描述符表:也就是一個數組,什么樣的數組呢?是一個段描述符組成的數組。?
段選擇子:也就是數組的索引,但這時候的索引不在是高級語言中數組的下標,而是我們將要找的那個段描述符相對于數組首地址(也就是全局描述表的首地址)偏移位置。?
就這么簡單,如圖:
圖中,通過Selector(段選擇子)找到存儲在Descriptor Table(描述符表)中某個Descriptor(段描述符),該段描述符中存放有該段的物理首地址,所以就可以找到內存中真正的物理段首地址Segment?
Offset(偏移量):就是相對該段的偏移量?
物理首地址 + 偏移量 就得到了物理地址 本圖就是DATA?
但這時,心細的朋友就發現了一個GDTR這個家伙還沒有提到!?
我們來看一下什么是GDTR?
Global Descriptor Table Register(全局描述符表寄存器)?
但是這個寄存器有什么用呢 ??
大家想一下,段描述符表現在是存放在內存中,那CPU是如何知道它在哪里呢?所以,Iterl公司設計了一個全局描述符表寄存器,專門用來存放段描述符表的首地址,以便找到內存中段描述符表。?
這時,段描述符表地址被存到GDTR寄存器中了。?
=================================?
好了,分析就到這,我們來看一下正式的定義:?
當x86 CPU 工作在保護模式時,可以使用全部32根地址線訪問4GB的內存,因為80386的所有通用寄存器都是32位的,所以用任何一個通用寄存器來間接尋址,不比分段就可以訪問4G空間中任意的內存地址。?
但 這并不意味著,此時段寄存器就不再有用了。實際上,段寄存器更加有用了,雖然再尋址上沒有分段的限制了,但在保護模式下,一個地址空間是否可以被寫入,可 以被多少優先級的代碼寫入,是不是允許執行等等涉及保護的問題就出來了。要解決這些問題,必須對一個地址空間定義一些安全上的屬性。段寄存器這時就派上了 用場。但是設計屬性和保護模式下段的參數,要表示的信息太多了,要用64位長的數據才能表示。我們把著64位的屬性數據叫做段描述符,上面說過,它包含3 個變量:?
段物理首地址、段界限、段屬性?
80386的段寄存器是16位(注意:通用寄存器在保護模式下都是32位,但段寄存器沒有被改 變)的,無法放下保護模式下64位的段描述符。如何解決這個問題呢?方法是把所有段的段描述符順序存放在內存中的指定位置,組成一個段描述符表 (Descriptor Table);而段寄存器中的16位用來做索引信息,這時,段寄存器中的信息不再是段地址了,而是段選擇子(Selector)??梢酝ㄟ^它在段描述符表 中“選擇”一個項目已得到段的全部信息。?
那么段描述符表存放在哪里呢?80386引入了兩個新的寄存器來管理段描述符,就是GDTR和LDTR,(LDTR大家先忘記它,隨著學習的深入,我們會在以后學習)。?
這樣,用以下幾步來總體體驗下保護模式下尋址的機制?
1、段寄存器中存放段選擇子Selector?
2、GDTR中存放著段描述符表的首地址?
3、通過選擇子根據GDTR中的首地址,就能找到對應的段描述符?
4、段描述符中有段的物理首地址,就得到段在內存中的首地址?
5、加上偏移量,就找到在這個段中存放的數據的真正物理地址。?
好的,那我們開始編碼,看看如何實現先前描述的內容?
=================================?
首先,既然我們需要一個數組,全局描述符表,那我們就定義一塊連續的結構體:?
[SECTION .gdt] ;為了代碼可讀性,我們將這個數組放到一個節中?
;由一塊連續的地址組成的,不就是一個數組嗎?看下面代碼,^_^?
段基地址 段界限 段屬性?
GDT_BEGIN: Descriptor 0,?? 0, 0?
GDT_CODE32: Descriptor 0, 0, DA_C?
;上面,我定義了二個連續地址的結構體,大家先認為Descriptor就是一個結構體類型,我們會在以后詳細講述?
;第一個結構體,全部是0,是為了遵循Interl規范,先記得就OK?
;第二個定義了一個代碼段,段基地址和段界限我們暫且還不知道,先初始化為0,但是因為是個代碼段,代碼段具備執行的屬性,那么DA_C就代表是一個可執行代碼段,DA_C是一個預先定義好的常量,我們會在詳細講解段描述符中講解。?
=================================?
我們繼續來實現,那么下面,我們就需要設計段選擇子了,因為上面代碼已經包含了段描述符和全局描述符表?
還記得選擇子是個什么東西嗎 ??
段選擇子:?? 也就是數組的索引,但這時候的索引不在是高級語言中數組的下標,而是我們將要找的那個段描述符相對于數組首地址(也就是全局描述表的首地址)偏移位置。?
看我代碼怎么實現,包含以上代碼不再說明:?
[SECTION .gdt]?
GDT_BEGIN: Descriptor 0, 0, 0?
GDT_CODE32: Descriptor 0, 0, DA_C?
;下面是定義代碼段選擇子,它就是相對數組首地址的偏移量?
SelectorCode32 equ GDT_CODE32 - GDT_BEGIN?
;因為第一個段描述符,不被使用,所以就不比設置段選擇子了。?
=================================?
偏移地址:?
注意一點,我們在程序中使用的都是偏移地址,相對于段的偏移地址,用上面的例子來說,象?GDT_CODE32 GDT_BEGIN 這些結構體的首地址都是相對于數據段的偏移量。什么意思呢 ??
因為我們的程序到底加載到內存的哪個地方是不固定,不知道的,只需使用偏移地址操作就行了,如:?
SelectorCode32 ,它本身就是一個偏移地址?
但是SelectorCode32 equ GDT_CODE32 - GDT_BEGIN?
怎么解釋呢 ??
GDT_CODE32是相對于數據段的偏移量,?
GDT_BEGIN也是相對于數據段的偏移量,雖然它是數組的首地址,說的羅索一些,GDT_BEGIN是數組的首地址(用數組的概念來理解頁不錯哦可以看作數組下標0),但是它是相對于數據段的偏移量?
那么兩個偏移量相減就是GDT_CODE32 相對于GDT_BEGIN的偏移量 (這個記住就行了,同時也是兩個偏移量的長度)
舉個例子:0 1 2 3,一個偏移0表示占據 0這個地址,一個偏移3表示占據3這個地址(談偏移要把前面要偏移的那個參照物拿掉,去掉要偏移的參照物(其實就可以數學表示成減前一個偏移參照物),剩下的就是偏移量),3這個地址相對與0這個地址的偏移量是把0這個地址先起掉后再算。(再結合數組來理解就可以了)
所以,我們要時時刻刻記得,在程序中,我們永遠使用的是偏移量,因為我們不知道程序將要被加載內存那塊地方。?
好了,基礎也學的差不多了,下面我們要自己動手寫一段程序,實現實模式到保護模式之間的跳轉?
=====================================================================?
;實現從實模式到保護模式之間的跳轉?
;參考:《自己動手寫操作系統》?
----------------------------------------------------------------------?
%include "pm.inc"
org 0100h?
jmp LABEL_BEGIN?
[SECTION .gdt]?
GDT_BEGIN: Descriptor 0, 0,?? 0?
GDT_CODE32: Descriptor?0, LenOfCode32 - 1, DA_C + DA_32???//程序段描述符的基地址首先置位0,以后還要重置為32位程序段物理首地址
GDT_VIDEO: Descriptor 0B8000H, 0FFFFH,?? DA_DRW???????????????//這個32位程序段的物理首地址是在實模式下計算得到的。
GdtLen equ $ - GDT_BEGIN???????//長度=偏移量1---偏移量2 。如偏移4-偏移2得到長度為2?。? $表示當前的偏移量
GdtPtr dw GdtLen - 1??????????????????//定義了一個Gdtptr的數據結構,低16位dw部分為位段界限,高32位為0,一共48位,高32位以后還要重置
dd?0?????????????????????????????????????????????//0,1為低16位,高32位是從2開始,所以GdtPtr+2。高32位應該放GDT的物理地址
;定義段選擇子?
SelectorCode32 equ GDT_CODE32 - GDT_BEGIN?
SelectorVideo equ GDT_VIDEO - GDT_BEGIN?
[SECTION .main]?
[BITS 16]?
LABEL_BEGIN:?
mov ax, cs?
mov ds, ax???????????????????????????? //這個ds es ss等于cs 表示代碼段和數據段在同一個街道上,只是偏移量不一樣。
mov es, ax?
mov ss, ax?????????????????????????? //段寄存器就相當于街道號,偏移量就相當于門牌號。只有兩者組合起來才能形成真正的物理地址。
????????????????????????????????????????? //看到段寄存器就應該想象成街道號,看到偏移量就應該想象成門牌號
????????????????????????????????????????? //如果代碼中只出現偏移量,實際上也是和操作系統所默認的這個偏移量的段寄存器(只是代碼沒有顯式給出而已)一起組成物理地址,(如ip它默認的段寄存 器就是cs),代碼也可以顯式給出段寄存器和偏移量,這個時候的段寄存器就不一定是這個偏移量所默認的段寄存器。
1、初始化32位代碼段描述符的段基址
;我們可以在實模式下通過段寄存器×16 + 偏移兩 得到物理地址,?
;那么,我們就可以將這個物理地址放到段描述符中,以供保護模式下使用,?
;因為保護模式下只能通過段選擇子 + 偏移量?
xor eax, eax ? //同或運算,這里是將eax清零
mov ax,?cs? ? ?
shl eax, 4 ? ? ?//左移四位,相當于乘以16,實模式下計算物理地址
add eax, LABEL_CODE32 ? ? ? ? ? ?//加上段相對代碼段的偏移地址,等于段的基地址,eax中為32位段的物理地址
mov word [GDT_CODE32 + 2],ax???? //?物理地址的ax放在段基址 2,3字節
shr eax, 16 ?//將eax向右移動16位,低位被拋棄,高位變成了低位
mov byte [GDT_CODE32 + 4],al ? ??//低16位又可以分為al,和 ah,那么現在我們就將al放到4位置,ah放到7位置
mov byte [GDT_CODE32 + 7],ah?
2、得到段描述符表的物理地址,并將其放到GdtPtr中?
xor eax, eax?
mov ax,?ds???????????????????????????????????????//?GDT的段地址為數據寄存器DS,
shl eax, 4?
add eax, GDT_BEGIN?????????????????????//DS加上偏移量GDT_BEGIN就是GDT的物理地址?
mov dword [GdtPtr + 2],eax????????????//dword 表示是雙字所以為32位,eax也是32位啊。
;加載到gdtr,因為現在段描述符表在內存中,我們必須要讓CPU知道段描述符 表在哪個位置?
;通過使用lgdtr就可以將源加載到gdtr寄存器中?
lgdt [GdtPtr]?
3、關中斷?
cli?
4、打開A20線?
in al, 92h ?//從92h號端口讀入一個字節
or al, 00000010b ?
out 92h, al ?//向92h號端口寫入一個字節
5、準備切換到保護模式,設置PE為1?
mov eax, cr0 ?//CR0也是一個寄存器,其中有個PE位,如果為0,就說明為實模式,?
? ? ?//如果置1,說明為保護模式?,F在我們要進入保護模式下工作,那么就要設置PE為1。?
or eax, 1?
mov cr0, eax?
;現在已經處在保護模式分段機制下,所以尋址必須使用段選擇子:偏移量來 尋址?
6、跳轉到32位代碼段中?
;因為此時偏移量位32位,所以必須dword告訴編譯器,不然,編譯器將編譯成16位?
jmp?dword?SelectorCode32:0 ? ? ? ?;跳轉到32位代碼段第一條指令開始執行
[SECTION .code32]?
[BITS 32]?
LABEL_CODE32:?
mov ax, SelectorVideo ? ? ? ??//視頻選擇子,用于找到顯存段的描述符
mov es, ax?
xor edi, edi?
mov edi, (80 * 10 + 10) ? //屏幕的第10行,第0列
mov ah, 0ch ? //0000:黑底 ? 1100:紅字
mov al, 'G' ???
mov [es:edi],ax?
jmp $?
LenOfCode32 equ $ - LABEL_CODE32?
===================================?
這段代碼的大概意思是:?
先 在16位代碼段,實模式下運行,在實模式下,通過段寄存器×16+偏移量得到32位代碼的真正物理首地址,并將放入到段描述符表中,以供在保護模式下使 用,上面說過了,保護模式下尋址,是通過段選擇子,段描述符表,段描述符一起工作尋址的。所以在實模式下所做的工作就是初始化段描述符表里的所有段描述 符。?
我們來看一下段描述符表,它有3個段描述符:?
GDT_BEGIN?
GDT_CODE32?
GDT_VIDEO?
GDT_BEGIN,遵循Intel公司規定,全部置0?
GDT_CODE32,32位代碼段描述符,供保護模式下使用?
GDT_VIDEO,顯存段首地址,我們知道,顯存首地址是0B8000H.?
回想一下,我們在實模式下往顯示器上輸出文字時,我們設置段寄存器為?
0B800h,(注意后面比真正物理地址少一個0)。?
而我們現在在保護模式下訪問顯存,那么0B8000h就可以直接放到段描述符中即可。因為段描述符中存放的是段的真正的物理地址。?
下面我們來逐行分析該代碼?
org 0100h?
這句話告訴加載器,將這段程序加載到偏移段首地址0100h處,即:偏移256字節處,為什么要加載到偏移256個字節處呢 ?
這是因為,在DOS中,需要留下256個字節和DOS系統進行通信。?
jmp LABEL_BEGIN?
執行這句話就跳轉到LABEL_BEGIN處開始執行。?
好,我們看一下LABEL_BEGIN在那塊,也就是16位代碼段?
[SECTION .main]?
[BITS 16]?
LABEL_BEGIN: (意味著運行在實模式)
這樣程序就從.main節的第一段代碼開始執行。?
我們看一下上面的代碼,[BITS 16]告訴編譯器,這是一個16位代碼段,所使用的寄存器都是16位寄存器。?
該代碼段初始化所有段描述符表中的段物理首地址?
首先在實模式下計算出32位代碼段的物理首地址?
對照 段值 × 16 + 偏移量 = 物理地址?
1 mov ax, cs ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
2 shl eax, 4 ?// CS存儲著有操作體統分配的代碼段值,段值*16 得到代碼段的物理首地址(注意這是在實模? 式下)
;到現在為止,eax就是代碼段的物理首地址了,那么。。???
3 add eax, LABEL_CODE32??????????//? 所有的諸如LABEL_CODE32:這樣的都表示是偏移量,因為物理首地址的段值是由操作系統分配的。
;為eax (代碼段首地址)加上 LABEL_CODE32偏移量,得到的不就是LABEL_CODE32的真正物理地址了嗎 ?
上面說過,代碼中,使用的變量,或者標簽 都是相對程序物理首地址的偏移量。如:LABEL_CODE32 這個標簽就是相對程序物理首地址的偏移量。
OK,現在我們已經知道了32位代碼段的物理首地址,那么將eax放入到段描述符中就行了?
我們先假設Descriptor就是一個結構體類型,(實際它是一個宏定義的數據結構,為了不影響整體思路,我們放到以后講)?
看一下這個Descriptor段描述符的內存模型:?
; 高地址………………………………………………………………………低地址?
; |?? 7?? |?? 6?? |?? 5?? |?? 4?? |?? 3?? |?? 2?? |?? 1?? |?? 0?? |?
共 8 字節?
; |--------========--------========--------========--------========|?
; ┏━━━┳━━━━━━━┳━━━━━━━━━━━┳━━━━━━━┓?
; ┃31..24┃?? 段屬性?? ┃?? 段基址(23..0)?? ┃ 段界限(15..0)┃?
; ┃?? ┃?????? ┃?? |?????? ┃?????? ┃?
; ┃ 基址2┃?????? ┃基址1b│?? 基址1a?? ┃?? 段界限1 ┃?
; ┣━━━╋━━━┳━━━╋━━━━━━━━━━━╋━━━━━━━┫?
; ┃?? %6 ┃ %5 ┃ %4 ┃ %3 ┃?? %2?? ┃?? %1?? ┃?
; ┗━━━┻━━━┻━━━┻━━━┻━━━━━━━┻━━━━━━━┛?
由于歷史原因,段描述符的內存排列不是按照 段基地址 段界限 段屬性 這樣的來排列的,所以我們現在要想一種辦法,把eax里所存放的物理首地址拆開,分別放到2,3,4,7字節處?
那么很顯然,我們可以將eax寄存器中的ax先放到2,3字節處?
mov word [GDT_CODE32 + 2],ax??// 這種內存訪問方式也是很常見的,首地址為數據寄存器提供(這里數據寄存器等于代碼寄存器),GDT_CODE32為偏移量,再加2
因為在偏移2個字節處,所以,首地址 + 2,才能定位到下標為2的字節開頭處?
而,word 告訴編譯器,我要一次訪問2個字節的內存?
好,簡單的搞定了,那么再看,我們現在要將eax高16字節分別放到下標為4,7字節處。?
雖然eax的ax代表低16位,但是Intel并沒有給高位一個名字定義,(不會是high ax,呵呵),所以,我們沒有辦法去訪問高位。但是我們可以將高16位放到低16位中,因為這時,低16位我們已經不關心它的值了。?
好,看代碼?
shr eax, 16?
這句代碼就將eax向右移動16位,低位被拋棄,高位變成了低位。呵呵。。。?
現在好辦了,低16位又可以分為al,和 ah,那么現在我們就將al放到4位置,ah放到7位置吧?
mov byte [GDT_CODE32 + 4], AL?
mov byte [GDT_CODE32 + 7], AH?
不用我再解釋這段代碼了,自己去分析為什么吧。。。。
//上面程序的功能是把32位程序段的物理首地址放到程序段描述符的段基址中,以便跳轉到保護模式時,可以使用選擇子選用程序段描述符,從而得到32位程序段的物理首地址。
好了,32位代碼段描述符設置好了,其界限設置看代碼吧,為什么要那樣設置,很簡單的,界限 = 長度 - 1,段屬性:?
DA_C: 98h?? 可執行?
DA_32: 4000h 32位代碼段?
是個常量,換算成二進制位,對照段描述符屬性位置去看吧,參考任意一本保護模式書。?
段描述符設置好了,但是,這段描述符表,還在內存中,我們必須想辦法放到寄存器中,這時,就用到了gdtr(Golbal Descriptor Table Register),使用一條指令?
lgdtr [GdtPtr]?
就可以將GdtPtr加載到gdtr中?
而gdtr的內存模型是:?
高字節?????????????? 低字節
但GdtPtr是什么呢 ??
就是我們定義的和這個寄存器內存模型一摸一樣的結構體:?
GdtLen equ $ - LABEL_BEGIN?
GdtPtr dw GdtLen - 1?? ;界限?
dd 0?? ;真正物理地址?
那現在我們就要計算GdtPtr第二個字節 也就是真正物理地址了?
xor eax, eax?
mov ax, ds?
shl eax, 4?
add eax, GDT_BEGIN?
mov?dword?[GdtPtr + 2],eax??????????????// dword表示為32位
自己分析吧,和計算32位段首地址基本一樣的,?
搞定后,使用lgdt [GdtPtr]就將此加載到寄存器GDTR中了?
然后關中斷?
cli 實模式下的中斷和保護模式下的中斷處理不一樣,那就關吧,規矩?
開啟A20線?
in al, 92h?
or al, 00000010b?
out 92h, al?
如果不開啟A20線,就無辦法訪問1M之上的內存,沒辦法,開啟吧,規矩,想知道歷史了,去查吧?
然后設置CR0的PE位?
mov eax, cr0?
or eax, 1?
mov cr0, eax?
這個簡單說一下,以后再詳細?
CR0也是一個寄存器,其中有個PE位,如果為0,就說明為實模式,?
如果置1,說明為保護模式。現在我們要進入保護模式下工作,那么就要設置PE為1。?
好了,看一下這個main節中的最后一個代碼?
jmp dword SelectorCode32 : 0?
哈哈,現在已經再保護模式下了,當然要使用段選擇子 + 偏移量來尋址啊,這樣不就是尋址到了32位代碼段中去了嗎,偏移量為0不就說明從第一個代碼開始執行。?
不是嗎 ?呵呵,那dword了??
因為現在的代碼段是16位,編譯器只能將它編譯位16位,但處于保護模式下,它的偏移量應該是32位,所以,要顯示告訴編譯器,我這里使用的是32位,把我這塊給編譯成32位的!!!?
如果不加dword,?
jmp SelectorCode32:0?
這句話不會出什么問題,16位的0是0,32位的0還是0,但如果這樣呢?:?
jmp SelectorCode32:0x12345678?
跳轉到偏移0x12345678中,這時就錯了?
如果不將dword,編譯器就將該地址截斷成16位,取低位,變成了0x5678?
你說對嗎 ?哈哈?
所以我們必須這樣做:?
jmp dword SelectorCodde32:0x12345678?
OKEY,我們繼續追擊,執行完上面那個跳轉后,?
代碼就跳到了32位代碼段的中,開始執行第一條指令?
mov ax, SelectorVideo?
再看?
mov es,ax?????????????????????????//現在已經在保護模式下,通過選擇子找到顯存的基址放
繼續看下面代碼?
xor edi, edi?
mov edi, (80 * 10 + 10)?
mov ah, 0ch?
mov al, 'G'?
跟實模式下差不多,設置目標10行10列?
設置現實字符:G?
mov [es:edi],ax?
也和實模式下一樣,?
只不過實模式是這樣來尋址 :?
es×16 + edi?
而保護模式下呢?
es是一個偏移,根據這個偏移找到段描述符表中的對應顯存段,然后這個顯存段里存放的就是0B8000h,然后在加上偏移 不就的了嗎!!!?
哈哈 。。。。程序分析完畢,細節之處,自己體會去?
總結:?
1. 注意程序中使用的全部是偏移地址。注意兩種偏移地址?
A 對于程序的起始地址來說, 所有變量和標簽都是相對于整個程序的偏移量?
B 對于段中定義的代碼,有兩種偏移:?
相對于程序起始地址的偏移?
相對于段標簽的偏移。?
2.不管是實模式下的物理地址,還是保護模式下的物理地址,反正他們都是物理地址,呵呵,實模式下求的物理地址,也能在保護模式下使用,只是他們不同的是,如何尋址的方式不一樣。?
3.一個程序中可以包含多個不同位的段,32位或者16位,他們之間也可以互相跳轉,只是32位段用的是32位寄存器,16位代碼段用的是16位寄存器,如果要在16位段下使用32位寄存器,必須象高級語言中強制類型轉換一樣,顯示的定義 dword?
參考: 《自動動手寫操作系統》?
《Undocument Windows 2000 Secrets》?
《Linux 內核完全剖析》
總結
以上是生活随笔為你收集整理的《一个操作系统的实现》——pmtest1.asm详解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 磁头号和起始扇区的计算方法------软
- 下一篇: LGDT/LIDT - 加载全局/中断描