計(jì)算機(jī)中所有的數(shù)據(jù)都必須放在內(nèi)存中,不同類(lèi)型的數(shù)據(jù)占用的字節(jié)數(shù)不一樣,例如 int 占用4個(gè)字節(jié),char 占用1個(gè)字節(jié)。為了正確地訪問(wèn)這些數(shù)據(jù),必須為每個(gè)字節(jié)都編上號(hào)碼,就像門(mén)牌號(hào)、身份證號(hào)一樣,每個(gè)字節(jié)的編號(hào)是唯一的,根據(jù)編號(hào)可以準(zhǔn)確地找到某個(gè)字節(jié)。
下圖是 4G 內(nèi)存中每個(gè)字節(jié)的編號(hào)(以十六進(jìn)制表示):
#include
int main(){
int a = 100;
char str[20] = 'c.biancheng.net';
printf('%#X, %#X\n', &a, str);
return 0;
}
運(yùn)行結(jié)果:
0X28FF3C, 0X28FF10%#X
表示以十六進(jìn)制形式輸出,并附帶前綴0X
。a 是一個(gè)變量,用來(lái)存放整數(shù),需要在前面加&
來(lái)獲得它的地址;str 本身就表示字符串的首地址,不需要加&
。
C語(yǔ)言用變量來(lái)存儲(chǔ)數(shù)據(jù),用函數(shù)來(lái)定義一段可以重復(fù)使用的代碼,它們最終都要放到內(nèi)存中才能供 CPU 使用。
數(shù)據(jù)和代碼都以二進(jìn)制的形式存儲(chǔ)在內(nèi)存中,計(jì)算機(jī)無(wú)法從格式上區(qū)分某塊內(nèi)存到底存儲(chǔ)的是數(shù)據(jù)還是代碼。當(dāng)程序被加載到內(nèi)存后,操作系統(tǒng)會(huì)給不同的內(nèi)存塊指定不同的權(quán)限,擁有讀取和執(zhí)行權(quán)限的內(nèi)存塊就是代碼,而擁有讀取和寫(xiě)入權(quán)限(也可能只有讀取權(quán)限)的內(nèi)存塊就是數(shù)據(jù)。
CPU 只能通過(guò)地址來(lái)取得內(nèi)存中的代碼和數(shù)據(jù),程序在執(zhí)行過(guò)程中會(huì)告知 CPU 要執(zhí)行的代碼以及要讀寫(xiě)的數(shù)據(jù)的地址。如果程序不小心出錯(cuò),或者開(kāi)發(fā)者有意為之,在 CPU 要寫(xiě)入數(shù)據(jù)時(shí)給它一個(gè)代碼區(qū)域的地址,就會(huì)發(fā)生內(nèi)存訪問(wèn)錯(cuò)誤。這種內(nèi)存訪問(wèn)錯(cuò)誤會(huì)被硬件和操作系統(tǒng)攔截,強(qiáng)制程序崩潰,程序員沒(méi)有挽救的機(jī)會(huì)。
CPU 訪問(wèn)內(nèi)存時(shí)需要的是地址,而不是變量名和函數(shù)名!變量名和函數(shù)名只是地址的一種助記符,當(dāng)源文件被編譯和鏈接成可執(zhí)行程序后,它們都會(huì)被替換成地址。編譯和鏈接過(guò)程的一項(xiàng)重要任務(wù)就是找到這些名稱(chēng)所對(duì)應(yīng)的地址。
假設(shè)變量 a、b、c 在內(nèi)存中的地址分別是 0X1000、0X2000、0X3000,那么加法運(yùn)算c = a + b;
將會(huì)被轉(zhuǎn)換成類(lèi)似下面的形式:
0X3000 = (0X1000) + (0X2000);
( )
表示取值操作,整個(gè)表達(dá)式的意思是,取出地址 0X1000 和 0X2000 上的值,將它們相加,把相加的結(jié)果賦值給地址為 0X3000 的內(nèi)存
變量名和函數(shù)名為我們提供了方便,讓我們?cè)诰帉?xiě)代碼的過(guò)程中可以使用易于閱讀和理解的英文字符串,不用直接面對(duì)二進(jìn)制地址,那場(chǎng)景簡(jiǎn)直讓人崩潰。
需要注意的是,雖然變量名、函數(shù)名、字符串名和數(shù)組名在本質(zhì)上是一樣的,它們都是地址的助記符,但在編寫(xiě)代碼的過(guò)程中,我們認(rèn)為變量名表示的是數(shù)據(jù)本身,而函數(shù)名、字符串名和數(shù)組名表示的是代碼塊或數(shù)據(jù)塊的首地址。
指針變量保存的是地址,本質(zhì)上是一個(gè)整數(shù),可以進(jìn)行部分運(yùn)算,例如加法、減法、比較等,請(qǐng)看下面的代碼:
#include
int main(){
int a = 10, *pa = &a, *paa = &a;
double b = 99.9, *pb = &b;
char c = '@', *pc = &c;
//最初的值
printf('&a=%#X, &b=%#X, &c=%#X\n', &a, &b, &c);
printf('pa=%#X, pb=%#X, pc=%#X\n', pa, pb, pc);
//加法運(yùn)算
pa++; pb++; pc++;
printf('pa=%#X, pb=%#X, pc=%#X\n', pa, pb, pc);
//減法運(yùn)算
pa -= 2; pb -= 2; pc -= 2;
printf('pa=%#X, pb=%#X, pc=%#X\n', pa, pb, pc);
//比較運(yùn)算
if(pa == paa){
printf('%d\n', *paa);
}else{
printf('%d\n', *pa);
}
return 0;
}
運(yùn)行結(jié)果:
從運(yùn)算結(jié)果可以看出:pa、pb、pc 每次加 1,它們的地址分別增加 4、8、1,正好是 int、double、char 類(lèi)型的長(zhǎng)度;減 2 時(shí),地址分別減少 8、16、2,正好是 int、double、char 類(lèi)型長(zhǎng)度的 2 倍。
這很奇怪,指針變量加減運(yùn)算的結(jié)果跟數(shù)據(jù)類(lèi)型的長(zhǎng)度有關(guān),而不是簡(jiǎn)單地加 1 或減 1,這是為什么呢?
以 a 和 pa 為例,a 的類(lèi)型為 int,占用 4 個(gè)字節(jié),pa 是指向 a 的指針,如下圖所示:
pa++;
使得地址加 1 的話,就會(huì)變成如下圖所示的指向關(guān)系:pa++;
使得地址加 4 的話,正好能夠完全跳過(guò)整數(shù) a,指向它后面的內(nèi)存,如下圖所示:#include
int main(){
int a = 1, b = 2, c = 3;
int *p = &c;
int i;
for(i=0; i8; i++){
printf('%d, ', *(p+i) );
}
return 0;
}
在 VS2010 Debug 模式下的運(yùn)行結(jié)果為:
3, -858993460, -858993460, 2, -858993460, -858993460, 1, -858993460,
可以發(fā)現(xiàn),變量 a、b、c 并不挨著,它們中間還參雜了別的輔助數(shù)據(jù)。
指針變量除了可以參與加減運(yùn)算,還可以參與比較運(yùn)算。當(dāng)對(duì)指針變量進(jìn)行比較運(yùn)算時(shí),比較的是指針變量本身的值,也就是數(shù)據(jù)的地址。如果地址相等,那么兩個(gè)指針就指向同一份數(shù)據(jù),否則就指向不同的數(shù)據(jù)。
上面的代碼(第一個(gè)例子)在比較 pa 和 paa 的值時(shí),pa 已經(jīng)指向了 a 的上一份數(shù)據(jù),所以它們不相等。而 a 的上一份數(shù)據(jù)又不知道是什么,所以會(huì)導(dǎo)致 printf() 輸出一個(gè)沒(méi)有意義的數(shù),這正好印證了上面的觀點(diǎn),不要對(duì)指向普通變量的指針進(jìn)行加減運(yùn)算。
另外需要說(shuō)明的是,不能對(duì)指針變量進(jìn)行乘法、除法、取余等其他運(yùn)算,除了會(huì)發(fā)生語(yǔ)法錯(cuò)誤,也沒(méi)有實(shí)際的含義。
聯(lián)系客服