得不深。其实这也就是为什么同一个班的学生,水平会相差非常大的最关键之处。学得好的,
往往是那些舍得钻研的学生。我平时上课教学生的绝不仅仅是知识点,更多的时候我在教他
们学习和解决问题的方法。有时候这个过程远比结论要重要的多。后面的内容,你也应该能
看出来,我非常注重过程的分析,只有你真正明白了这些思考问题、解决问题的方法和过程,
你才能真正立于不败之地。所有的问题对你来说都是一个样,没有本质的区别。解决任何问
题的办法都一致,那就是把没见过的、不会的问题想法设法转换成你见过的、你会的问题;
至于怎么去转换那就要靠你的苦学苦练了。也就是说你要达到手中无剑,胸中也无剑的地步。
当然这些只是我个人的领悟,写在这里希望能与君共勉。
4。2,数组
4。2。1,数组的内存布局
先看下面的例子:
inta'5';
所有人都明白这里定义了一个数组,其包含了
5个
int型的数据。我们可以用
a'0';a'1'
等来访问数组里面的每一个元素,那么这些元素的名字就是
a'0';a'1'…吗?看下面的示意
图:
5intaa'0';a'1'aaint20byte20byte5int5intaa'0';a'1'aaint20byte20byte5int
如上图所示,当我们定义一个数组
a时,编译器根据指定的元素个数和元素的类型分配确定
大小(元素类型大小*元素个数)的一块内存,并把这块内存的名字命名为
a。名字
a一旦
与这块内存匹配就不能被改变。a'0';a'1'等为
a的元素,但并非元素的名字。数组的每一个
元素都是没有名字的。那现在再来回答第一章讲解
sizeof关键字时的几个问题:
sizeof(a)的值为
sizeof(int)*5,32位系统下为
20。
sizeof(a'0')的值为
sizeof(int),32位系统下为
4。
sizeof(a'5')的值在
32位系统下为
4。并没有出错,为什么呢?我们讲过
sizeof是关键字
不是函数。函数求值是在运行的时候,而关键字
sizeof求值是在编译的时候。虽然并不存在
a'5'这个元素,但是这里也并没有去真正访问
a'5';而是仅仅根据数组元素的类型来确定其
值。所以这里使用
a'5'并不会出错。
sizeof(&a'0')的值在
32位系下为
4,这很好理解。取元素
a'0'的首地址。
sizeof(&a)的值在
32位系统下也为
4,这也很好理解。取数组
a的首地址。但是在
Visual
C++6。0上,这个值为
20,我认为是错误的。
4。2。2,省政府和市政的区别&a'0'和&a的区别
这里&a'0'和&a到底有什么区别呢?a'0'是一个元素,a是整个数组,虽然&a'0'和&a
的值一样,但其意义不一样。前者是数组首元素的首地址,而后者是数组的首地址。举个
例子:湖南的省政府在长沙,而长沙的市政府也在长沙。两个政府都在长沙,但其代表的
意义完全不同。这里也是同一个意思。
4。2。3,数组名
a作为左值和右值的区别
简单而言,出现在赋值符“
=”右边的就是右值,出现在赋值符“
=”左边的就是左值。
比如;x=y。
左值:在这个上下文环境中,编译器认为
x的含义是
x所代表的地址。这个地址只有
编译器知道,在编译的时候确定,编译器在一个特定的区域保存这个地址,我们完全不必
考虑这个地址保存在哪里。
右值:在这个上下文环境中,编译器认为
y的含义是
y所代表的地址里面的内容。这
个内容是什么,只有到运行时才知道。
C语言引入一个术语…“可修改的左值”。意思就是,出现在赋值符左边的符号所代
表的地址上的内容一定是可以被修改的。换句话说,就是我们只能给非只读变量赋值。
既然已经明白左值和右值的区别,下面就讨论一下数组作为左值和右值的情况:
当
a作为右值的时候代表的是什么意思呢?很多书认为是数组的首地址,其实这是非常
错误的。a作为右值时其意义与&a'0'是一样,代表的是数组首元素的首地址,而不是数组
的首地址。这是两码事。但是注意,这仅仅是代表,并没有一个地方(这只是简单的这么
认为,其具体实现细节不作过多讨论)来存储这个地址,也就是说编译器并没有为数组
a
分配一块内存来存其地址,这一点就与指针有很大的差别。
a作为右值,我们清楚了其含义,那作为左值呢?
a不能作为左值!这个错误几乎每一个学生都犯过。编译器会认为数组名作为左值代表
的意思是
a的首元素的首地址,但是这个地址开始的一块内存是一个总体,我们只能访问数
组的某个元素而无法把数组当一个总体进行访问。所以我们可以把
a'i'当左值,而无法把
a
当左值。其实我们完全可以把
a当一个普通的变量来看,只不过这个变量内部分为很多小块,
我们只能通过分别访问这些小块来达到访问整个变量
a的目的。
4。3,指针与数组之间的恩恩怨怨
很多初学者弄不清指针和数组到底有什么样的关系。我现在就告诉你:他们之间没有
任何关系!只是他们经常穿着相似的衣服来逗你玩罢了。
指针就是指针,指针变量在
32位系统下,永远占
4个
byte,其值为某一个内存的地址。
指针可以指向任何地方,但是不是任何地方你都能通过这个指针变量访问到。
数组就是数组,其大小与元素的类型和个数有关。定义数组时必须指定其元素的类型
和个数。数组可以存任何类型的数据,但不能存函数。
既然它们之间没有任何关系,那为何很多人把数组和指针混淆呢?甚至很多人认为指
针和数组是一样的。这就与市面上的
C语言的书有关,几乎没有一本书把这个问题讲透彻,
讲明白了。
4。3。1,以指针的形式访问和以下标的形式访问
下面我们就详细讨论讨论它们之间似是而非的一些特点。例如,函数内部有如下定义:
A);char*p
=
“abcdef”;
B);chara''=“123456”;
4。3。1。1,以指针的形式访问和以下标的形式访问指针
例子
A)定义了一个指针变量
p,p本身在栈上占
4个
byte,p里存储的是一块内存的首
地址。这块内存在静态区,其空间大小为
7个
byte,这块内存也没有名字。对这块内存的访
问完全是匿名的访问。比如现在需要读取字符‘e’,我们有两种方式:
1),以指针的形式:
*(p+4)。先取出
p里存储的地址值,假设为
0x0000FF00,然后加
上
4个字符的偏移量,得到新的地址
0x0000FF04。然后取出
0x0000FF04地址上的值。
2),以下标的形式:
p'4'。编译器总是把以下标的形式的操作解析为以指针的形式的操
作。p'4'这个操作会被解析成:先取出
p里存储的地址值,然后加上中括号中
4个元素的偏
移量,计算出新的地址,然后从新的地址中取出值。也就是说以下标的形式访问在本质上
与以指针的形式访问没有区别,只是写法上不同罢了。
4。3。1。2,以指针的形式访问和以下标的形式访问数组
例子
B)定义了一个数组
a,a拥有
7个
char类型的元素,其空间大小为
7。数组
a本身
在栈上面。对
a的元素的访问必须先根据数组的名字
a找到数组首元素的首地址,然后根据
偏移量找到相应的值。这是一种典型的“具名+匿名”访问。比如现在需要读取字符‘5’,
我们有两种方式:
1),以指针的形式:
*(a+4)。a这时候代表的是数组首元素的首地址,假设为
0x0000FF00,
然后加上
4个字符的偏移量,得到新的地址
0x0000FF04。然后取出
0x0000FF04地址上的
值。
2),以下标的形式:
a'4'。编译器总是把以下标的形式的操作解析为以指针的形式的操
作。a'4'这个操作会被解析成:a作为数组首元素的首地址,然后加上中括号中
4个元素的
偏移量,计算出新的地址,然后从新的地址中取出值。
由上面的分析,我们可以看到,指针和数组根本就是两个完全不一样的东西。只是它们
都可以“以指针形式”或“以下标形式”进行访问。一个是完全的匿名访问,一个是典型
的具名+匿名访问。一定要注意的是这个“以
XXX的形式的访问”这种表达方式。
另外一个需要强调的是:上面所说的偏移量
4代表的是
4个元素,而不是
4个
byte。只
不过这里刚好是
char类型数据
1个字符的大小就为
1个
byte。记住这个偏移量的单位是元
素的个数而不是
byte数,在计算新地址时千万别弄错了。
4。3。2,a和&a的区别
通过上面的分析,相信你已经明白数组和指针的访问方式了,下面再看这个例子:
main()
{
inta'5'={1;2;3;4;5};
int*ptr=(int*)(&a+1);
printf(〃%d;%d〃;*(a+1);*(ptr…1));
}
打印出来的值为多少呢?这里主要是考查关于指针加减操作的理解。
对指针进行加
1操作,得到的是下一个元素的地址,而不是原有地址值直接加
1。所以,
一个类型为
T的指针的移动,以
sizeof(T)为移动单位。因此,对上题来说,
a是一个一
维数组,数组中有
5个元素;
ptr是一个
int型的指针。
&a
+1:取数组
a的首地址,该地址的值加上
sizeof(a)的值,即
&a
+5*sizeof(int),也
就是下一个数组的首地址,显然当前指针已经越过了数组的界限。
(int*)(&a+1):则是把上一步计算出来的地址,强制转换为
int*类型,赋值给
ptr。
*(a+1):
a;&a的值是一样的,但意思不一样,a是数组首元素的首地址,也就是
a'0'的
首地址,
&a是数组的首地址,a+1是数组下一元素的首地址,即
a'1'的首地址;&a+1是下一
个数组的首地址。所以输出
2
*(ptr…1):因为
ptr是指向
a'5',并且
ptr是
int*类型,所以
*(ptr…1)是指向
a'4',
输出
5。
这些分析我相信大家都能理解,但是在授课时,学生向我提出了如下问题:
在
VisualC++6。0的
Watch窗口中&a+1的值怎么会是(x0012ff6d(0x0012ff6c+1)呢?
上图是在
VisualC++6。0调试本函数时的截图。
a在这里代表是的数组首元素的地址即
a'0'的首地址,其值为
0x0012ff6c。
&a代表的是数组的首地址,其值为
0x0012ff6c。
a+1的值是
0x0012ff6c+1*sizeof(int),等于
0x0012ff70。
问题就是&a+1的值怎么会是(x0012ff6d(0x0012ff6c+1)呢?
按照我们上面的分析应该为
0x0012ff6c+5*sizeof(int)。其实很好理解。当你把
&a+1
放到
Watch窗口中观察其值时,表达式
&a+1已经脱离其上下文环境,编译器就很简单的把
它解析为&a的值然后加上
1byte。而
a+1的解析就正确,我认为这是
VisualC++6。0的一个
bug。既然如此,我们怎么证明证明
&a+1的值确实为
0x0012ff6c+5*sizeof(int)呢?很好办,
用
printf函数打印出来。这就是我在本书前言里所说的,有的时候我们确实需要
printf函数
才能解决问题。你可以试试用
printf(〃%x〃;&a+1);打印其值,看是否为
0x0012ff6c+5*sizeof(int)。注意如果你用的是
printf(〃%d〃;&a+1);打印,那你必须在十进制和十六进制之间换算
一下,不要冤枉了编译器。
另外我要强调一点:不到非不得已,尽量别使用
printf函数,它会使你养成只看结果不
问为什么的习惯。比如这个列子,*(a+1)和*(ptr…1)的值完全可以通过
Watch窗口来查看。
平时初学者很喜欢用“
printf(〃%d;%d〃;*(a+1);*(ptr…1));”这类的表达式来直接打印出值,
如果发现值是正确的就欢天喜地。这个时候往往认为自己的代码没有问题,根本就不去查
看其变量的值,更别说是内存和寄存器的值了。更有甚者,
printf函数打印出来的值不正确,
就措手无策,举手问“老师,我这里为什么不对啊?”。长此以往就养成了很不好的习惯,
只看结果,不重调试。这就是为什么同样的几年经验,有的人水平很高,而有的人水平却
很低。其根本原因就在于此,往往被一些表面现象所迷惑。
printf函数打印出来的值是对的
就能说明你的代码一定没问题吗?我看未必。曾经一个学生,我让其实现直接插入排序算
法。很快他把函数写完了,把值用
printf函数打印出来给我看。我看其代码却发现他使用的
算法本质上其实是冒泡排序,只是写得像直接插入排序罢了。等等这种情况数都数不过来,
往往犯了错误还以为自己是对的。所以我平时上课之前往往会强调,不到非不得已,不允
许使用
printf函数,而要自己去查看变量和内存的值。学生的这种不好的习惯也与目前市面
上的教材、参考书有关,这些书甚至花大篇幅来介绍
scanf和
printf这类的函数,却几乎不
讲解调试技术。甚至有的书还在讲
TruboC2。0之类的调试器!如此教材教出来的学生质量
可想而知。
4。3。3,指针和数组的定义与声明
4。3。3。1,定义为数组,声明为指针
文件
1中定义如下:
chara'100';
文件
2中声明如下(关于
extern的用法,以及定义和声明的区别,请复习第一章):
externchar*a;
这里,文件
1中定义了数组
a,文件
2中声明它为指针。这有什么问题吗?平时不是总说数
组与指针相似,甚至可以通用吗?但是,很不幸,这是错误的。通过上面的分析我们也能
明白一些,但是“革命尚