《[免费下载 c语言深度解剖[1]》

下载本书

添加书签

[免费下载 c语言深度解剖[1]- 第14部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
得不深。其实这也就是为什么同一个班的学生,水平会相差非常大的最关键之处。学得好的,
往往是那些舍得钻研的学生。我平时上课教学生的绝不仅仅是知识点,更多的时候我在教他
们学习和解决问题的方法。有时候这个过程远比结论要重要的多。后面的内容,你也应该能
看出来,我非常注重过程的分析,只有你真正明白了这些思考问题、解决问题的方法和过程,
你才能真正立于不败之地。所有的问题对你来说都是一个样,没有本质的区别。解决任何问
题的办法都一致,那就是把没见过的、不会的问题想法设法转换成你见过的、你会的问题;
至于怎么去转换那就要靠你的苦学苦练了。也就是说你要达到手中无剑,胸中也无剑的地步。

当然这些只是我个人的领悟,写在这里希望能与君共勉。

4。2,数组
4。2。1,数组的内存布局
先看下面的例子: 


inta'5';

所有人都明白这里定义了一个数组,其包含了 
5个 
int型的数据。我们可以用 
a'0';a'1'
等来访问数组里面的每一个元素,那么这些元素的名字就是 
a'0';a'1'…吗?看下面的示意
图:


5intaa'0';a'1'aaint20byte20byte5int5intaa'0';a'1'aaint20byte20byte5int
如上图所示,当我们定义一个数组 
a时,编译器根据指定的元素个数和元素的类型分配确定
大小(元素类型大小*元素个数)的一块内存,并把这块内存的名字命名为 
a。名字 
a一旦
与这块内存匹配就不能被改变。a'0';a'1'等为 
a的元素,但并非元素的名字。数组的每一个
元素都是没有名字的。那现在再来回答第一章讲解 
sizeof关键字时的几个问题: 


sizeof(a)的值为 
sizeof(int)*5,32位系统下为 
20。 


sizeof(a'0')的值为 
sizeof(int),32位系统下为 
4。 


sizeof(a'5')的值在 
32位系统下为 
4。并没有出错,为什么呢?我们讲过 
sizeof是关键字
不是函数。函数求值是在运行的时候,而关键字 
sizeof求值是在编译的时候。虽然并不存在 
a'5'这个元素,但是这里也并没有去真正访问 
a'5';而是仅仅根据数组元素的类型来确定其
值。所以这里使用 
a'5'并不会出错。 


sizeof(&a'0')的值在 
32位系下为 
4,这很好理解。取元素 
a'0'的首地址。 


sizeof(&a)的值在 
32位系统下也为 
4,这也很好理解。取数组 
a的首地址。但是在 
Visual 
C++6。0上,这个值为 
20,我认为是错误的。 


4。2。2,省政府和市政的区别&a'0'和&a的区别
这里&a'0'和&a到底有什么区别呢?a'0'是一个元素,a是整个数组,虽然&a'0'和&a
的值一样,但其意义不一样。前者是数组首元素的首地址,而后者是数组的首地址。举个
例子:湖南的省政府在长沙,而长沙的市政府也在长沙。两个政府都在长沙,但其代表的
意义完全不同。这里也是同一个意思。

4。2。3,数组名 
a作为左值和右值的区别
简单而言,出现在赋值符“ 
=”右边的就是右值,出现在赋值符“ 
=”左边的就是左值。
比如;x=y。

左值:在这个上下文环境中,编译器认为 
x的含义是 
x所代表的地址。这个地址只有
编译器知道,在编译的时候确定,编译器在一个特定的区域保存这个地址,我们完全不必


考虑这个地址保存在哪里。

右值:在这个上下文环境中,编译器认为 
y的含义是 
y所代表的地址里面的内容。这
个内容是什么,只有到运行时才知道。 


C语言引入一个术语…“可修改的左值”。意思就是,出现在赋值符左边的符号所代
表的地址上的内容一定是可以被修改的。换句话说,就是我们只能给非只读变量赋值。

既然已经明白左值和右值的区别,下面就讨论一下数组作为左值和右值的情况:

当 
a作为右值的时候代表的是什么意思呢?很多书认为是数组的首地址,其实这是非常
错误的。a作为右值时其意义与&a'0'是一样,代表的是数组首元素的首地址,而不是数组
的首地址。这是两码事。但是注意,这仅仅是代表,并没有一个地方(这只是简单的这么
认为,其具体实现细节不作过多讨论)来存储这个地址,也就是说编译器并没有为数组 
a
分配一块内存来存其地址,这一点就与指针有很大的差别。 


a作为右值,我们清楚了其含义,那作为左值呢? 


a不能作为左值!这个错误几乎每一个学生都犯过。编译器会认为数组名作为左值代表
的意思是 
a的首元素的首地址,但是这个地址开始的一块内存是一个总体,我们只能访问数
组的某个元素而无法把数组当一个总体进行访问。所以我们可以把 
a'i'当左值,而无法把 
a
当左值。其实我们完全可以把 
a当一个普通的变量来看,只不过这个变量内部分为很多小块,
我们只能通过分别访问这些小块来达到访问整个变量 
a的目的。

4。3,指针与数组之间的恩恩怨怨
很多初学者弄不清指针和数组到底有什么样的关系。我现在就告诉你:他们之间没有
任何关系!只是他们经常穿着相似的衣服来逗你玩罢了。

指针就是指针,指针变量在 
32位系统下,永远占 
4个 
byte,其值为某一个内存的地址。
指针可以指向任何地方,但是不是任何地方你都能通过这个指针变量访问到。

数组就是数组,其大小与元素的类型和个数有关。定义数组时必须指定其元素的类型
和个数。数组可以存任何类型的数据,但不能存函数。

既然它们之间没有任何关系,那为何很多人把数组和指针混淆呢?甚至很多人认为指
针和数组是一样的。这就与市面上的 
C语言的书有关,几乎没有一本书把这个问题讲透彻,
讲明白了。

4。3。1,以指针的形式访问和以下标的形式访问
下面我们就详细讨论讨论它们之间似是而非的一些特点。例如,函数内部有如下定义: 


A);char*p 
= 
“abcdef”; 


B);chara''=“123456”; 



4。3。1。1,以指针的形式访问和以下标的形式访问指针
例子 
A)定义了一个指针变量 
p,p本身在栈上占 
4个 
byte,p里存储的是一块内存的首
地址。这块内存在静态区,其空间大小为 
7个 
byte,这块内存也没有名字。对这块内存的访
问完全是匿名的访问。比如现在需要读取字符‘e’,我们有两种方式: 


1),以指针的形式: 
*(p+4)。先取出 
p里存储的地址值,假设为 
0x0000FF00,然后加
上 
4个字符的偏移量,得到新的地址 
0x0000FF04。然后取出 
0x0000FF04地址上的值。 
2),以下标的形式: 
p'4'。编译器总是把以下标的形式的操作解析为以指针的形式的操
作。p'4'这个操作会被解析成:先取出 
p里存储的地址值,然后加上中括号中 
4个元素的偏
移量,计算出新的地址,然后从新的地址中取出值。也就是说以下标的形式访问在本质上
与以指针的形式访问没有区别,只是写法上不同罢了。
4。3。1。2,以指针的形式访问和以下标的形式访问数组
例子 
B)定义了一个数组 
a,a拥有 
7个 
char类型的元素,其空间大小为 
7。数组 
a本身
在栈上面。对 
a的元素的访问必须先根据数组的名字 
a找到数组首元素的首地址,然后根据
偏移量找到相应的值。这是一种典型的“具名+匿名”访问。比如现在需要读取字符‘5’,
我们有两种方式: 


1),以指针的形式: 
*(a+4)。a这时候代表的是数组首元素的首地址,假设为 
0x0000FF00,
然后加上 
4个字符的偏移量,得到新的地址 
0x0000FF04。然后取出 
0x0000FF04地址上的
值。 
2),以下标的形式: 
a'4'。编译器总是把以下标的形式的操作解析为以指针的形式的操
作。a'4'这个操作会被解析成:a作为数组首元素的首地址,然后加上中括号中 
4个元素的
偏移量,计算出新的地址,然后从新的地址中取出值。
由上面的分析,我们可以看到,指针和数组根本就是两个完全不一样的东西。只是它们
都可以“以指针形式”或“以下标形式”进行访问。一个是完全的匿名访问,一个是典型
的具名+匿名访问。一定要注意的是这个“以 
XXX的形式的访问”这种表达方式。

另外一个需要强调的是:上面所说的偏移量 
4代表的是 
4个元素,而不是 
4个 
byte。只
不过这里刚好是 
char类型数据 
1个字符的大小就为 
1个 
byte。记住这个偏移量的单位是元
素的个数而不是 
byte数,在计算新地址时千万别弄错了。

4。3。2,a和&a的区别
通过上面的分析,相信你已经明白数组和指针的访问方式了,下面再看这个例子: 


main() 


{ 


inta'5'={1;2;3;4;5}; 


int*ptr=(int*)(&a+1); 


printf(〃%d;%d〃;*(a+1);*(ptr…1)); 


} 



打印出来的值为多少呢?这里主要是考查关于指针加减操作的理解。

对指针进行加 
1操作,得到的是下一个元素的地址,而不是原有地址值直接加 
1。所以,
一个类型为 
T的指针的移动,以 
sizeof(T)为移动单位。因此,对上题来说, 
a是一个一
维数组,数组中有 
5个元素; 
ptr是一个 
int型的指针。 


&a 
+1:取数组 
a的首地址,该地址的值加上 
sizeof(a)的值,即 
&a 
+5*sizeof(int),也
就是下一个数组的首地址,显然当前指针已经越过了数组的界限。 
(int*)(&a+1):则是把上一步计算出来的地址,强制转换为 
int*类型,赋值给 
ptr。 


*(a+1): 
a;&a的值是一样的,但意思不一样,a是数组首元素的首地址,也就是 
a'0'的
首地址, 
&a是数组的首地址,a+1是数组下一元素的首地址,即 
a'1'的首地址;&a+1是下一
个数组的首地址。所以输出 
2 
*(ptr…1):因为 
ptr是指向 
a'5',并且 
ptr是 
int*类型,所以 
*(ptr…1)是指向 
a'4',
输出 
5。
这些分析我相信大家都能理解,但是在授课时,学生向我提出了如下问题:

在 
VisualC++6。0的 
Watch窗口中&a+1的值怎么会是(x0012ff6d(0x0012ff6c+1)呢?


上图是在 
VisualC++6。0调试本函数时的截图。 


a在这里代表是的数组首元素的地址即 
a'0'的首地址,其值为 
0x0012ff6c。 


&a代表的是数组的首地址,其值为 
0x0012ff6c。 


a+1的值是 
0x0012ff6c+1*sizeof(int),等于 
0x0012ff70。

问题就是&a+1的值怎么会是(x0012ff6d(0x0012ff6c+1)呢?

按照我们上面的分析应该为 
0x0012ff6c+5*sizeof(int)。其实很好理解。当你把 
&a+1
放到 
Watch窗口中观察其值时,表达式 
&a+1已经脱离其上下文环境,编译器就很简单的把
它解析为&a的值然后加上 
1byte。而 
a+1的解析就正确,我认为这是 
VisualC++6。0的一个 
bug。既然如此,我们怎么证明证明 
&a+1的值确实为 
0x0012ff6c+5*sizeof(int)呢?很好办,
用 
printf函数打印出来。这就是我在本书前言里所说的,有的时候我们确实需要 
printf函数
才能解决问题。你可以试试用 
printf(〃%x〃;&a+1);打印其值,看是否为 
0x0012ff6c+5*sizeof(int)。注意如果你用的是 
printf(〃%d〃;&a+1);打印,那你必须在十进制和十六进制之间换算
一下,不要冤枉了编译器。

另外我要强调一点:不到非不得已,尽量别使用 
printf函数,它会使你养成只看结果不
问为什么的习惯。比如这个列子,*(a+1)和*(ptr…1)的值完全可以通过 
Watch窗口来查看。

平时初学者很喜欢用“ 
printf(〃%d;%d〃;*(a+1);*(ptr…1));”这类的表达式来直接打印出值,
如果发现值是正确的就欢天喜地。这个时候往往认为自己的代码没有问题,根本就不去查


看其变量的值,更别说是内存和寄存器的值了。更有甚者, 
printf函数打印出来的值不正确,
就措手无策,举手问“老师,我这里为什么不对啊?”。长此以往就养成了很不好的习惯,
只看结果,不重调试。这就是为什么同样的几年经验,有的人水平很高,而有的人水平却
很低。其根本原因就在于此,往往被一些表面现象所迷惑。 
printf函数打印出来的值是对的
就能说明你的代码一定没问题吗?我看未必。曾经一个学生,我让其实现直接插入排序算
法。很快他把函数写完了,把值用 
printf函数打印出来给我看。我看其代码却发现他使用的
算法本质上其实是冒泡排序,只是写得像直接插入排序罢了。等等这种情况数都数不过来,
往往犯了错误还以为自己是对的。所以我平时上课之前往往会强调,不到非不得已,不允
许使用 
printf函数,而要自己去查看变量和内存的值。学生的这种不好的习惯也与目前市面
上的教材、参考书有关,这些书甚至花大篇幅来介绍 
scanf和 
printf这类的函数,却几乎不
讲解调试技术。甚至有的书还在讲 
TruboC2。0之类的调试器!如此教材教出来的学生质量
可想而知。

4。3。3,指针和数组的定义与声明
4。3。3。1,定义为数组,声明为指针
文件 
1中定义如下: 


chara'100';

文件 
2中声明如下(关于 
extern的用法,以及定义和声明的区别,请复习第一章): 


externchar*a;
这里,文件 
1中定义了数组 
a,文件 
2中声明它为指针。这有什么问题吗?平时不是总说数
组与指针相似,甚至可以通用吗?但是,很不幸,这是错误的。通过上面的分析我们也能
明白一些,但是“革命尚
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架