讲在前面

指针是一个特殊的变量,它里面存储的数值被解释为内存里的一个地址,想要透彻地搞懂指针,就必须从计算机的底层进行解释。

内存在物理上是由一组DRAM芯片组成。程序在运行时数据便被保存在其中。而作为一个程序员,我们无需了解内存的物理结构。操作系统将硬件和软件结合起来,给程序员提供了一种对物理内存空间的抽象,这就是虚拟存储器。虚拟存储器是一块很大的空间,可以把它看成一个一个连续的小方格,每个方格的大小是一个字节,也就是8个比特位,可以存放一个8位的二进制数,比如10011000B,而每个小方格都被标上了编号,从零开始直到最后一个字节。

如果这是一个大小为2GB的虚拟存储器,它的虚拟存储器的大小变式2×1024的三次方字节,编号的范围是0~2×1024的3次方再减去1。正是因为每个内存空间都有独立且唯一的编号,当程序中的变量、常量、函数被载入到内存中时,也都有了唯一的编号,这个编号就是数据的地址。比如当你定义了一个int类型变量a并给a赋值为1,由于int类型的变量,在64位系统中大小通常为4个字节,C程序便会在这些“小方格”中找到4个方格,并同时将1转变为二进制,储存到这4个方格中。于是第1个方格的编号便是变量a的地址,我们可以使用 &(取地址运算符)来获取a变量的地址。

指针

因为直接操作内存中的值会大大提高,程序的效率指针便诞生了。指针也是一个数据类型,与我们常见的int,char,double相同。但是指针类型不是单独存在的,它是由其他类型派生而来的,它的类型可以是指向int的指针类型,或者指向double的指针类型,上两种情况可以分别使用这样的方法定义:int* a char* b

当完成定义后,C程序同样会在内存中划分出一块空间,用于存放指针类型的值,这个指针类型的值就是一个内存地址。

这里需要特别区分三个概念,指针类型、指针类型变量和指针类型的值。他们经常被简单地统称为指针,而搞的我们晕头转向。当李华定义了指针p并让它的值等于A变量的地址时,称做p是指向int类型变量A的指针,简称p指向A。此时指针类型的变量p的值是变量A在内存中存储的第1个地址单元的编号,也就是首地址。指针P的类型是int类型的指针,通过指针类型、C程序可以知道指针指向的数据占用了4个内存单元,从而正确地读出在该地址上存储的数据,明白这点非常重要。

指针也可以进行加减运算,当给一个指针加1时,其中的内存地址并不是简单的加一,而是根据指针的类型递增相应的大小。比如一个int类型的指针加1,它所保存的地址会加上int类型所占用的存储单元个数,也就是加4,从而使指针跨过当前数据指向下一个完整的数据。李华如何获取这块地纸上保存的值呢?这时需要用到 *(解引用运算符)。在指针变量的前面加上*,就可以表示这个指针所指向的内存单元中的值了。如果你成功地搞清楚了以上的内容,那么恭喜我们可以向着更深入的地方分析指针了。

我们知道,在程序设计中,为了处理方便,把具有相同类型的若干变量按有序的形式组织起来,这些按序排列的同类数据元素的集合称为数组。可以这样定义一个数组,当李华定义了一个长度为5的整形数组B时,C程序会在内存中连续划分出5个大小为4字节的存储空间,并把第1个格子的地址作为整个数组的地址,数组中的元素,依次命名为B0、B1、B2、B3、B4。我们可以认为数组名B就是一个指向该数组第1个元素的指针,与int* P基本等价。

所以当我们查找数组中的元素时,就有了两种方法,使用数组名中括号加下标的方式得到一个元素或者使用一个指针,先将指针加上一个数,使它指向你想读取的数据,在用解引用运算符获取当前值便可。为了更上一层楼,我们需要了解多维数组与指针,多维数组是数组的数组,我们使用类型加两个方括号的形式来定义一个二维数组。第1个方括号中存放二维数组中有多少个一维数组,第2个方括号中存放每一个一维数组的大小。比如这样就定义了一个二维数组C其中包含三个一维数组,数组名分别为C0、C1、C2,每个一维数组中包含4个整型的变量,与上面的介绍相似,二维数组名是一个指向整个二维数组首地址的指针,但是它的类型不再是int类型指针,而是int类型数组指针定义为int(*pz)[4],中括号中要明确一维数组的大小,比如4此时C、C0的值都是整个二维数组的首地址,我们对他们解引用都可以得到二维数组第1个元素C[0][0]的值。

但如果递增C,由于C的类型为二维指针,C+1便指向了第2个一维数组。如果递增C0,由于C0的类型为一维指针,C[0]+1便递增了4个内存单元指向了第1个一维数组的第2个元素。


题外话

推荐一本书,Kenneth A. Reek的Pointers on C(C和指针),比较详细地解释了C语言相关的内容,其中对于类似指针、效率、结构等方面的解释还算比较易懂且透彻,个人比较喜欢。