彻底粉碎“指针与数组的困惑”(上)

发表于:2007-07-01来源:作者:点击数: 标签:
摘要:指针是C语言的精髓,也算是C++的精髓吧,要掌握它不是很容易,特别是与数组经常弄混,希望通过本文,你能够有一个清楚的认识。 (1)一维数组与指针 首先我们看一下下面的例子: char a[10], *p; p=a; p是一个char类型的指针,它里面放的是数组a的首地

   摘要:指针是C语言的精髓,也算是C++的精髓吧,要掌握它不是很容易,特别是与数组经常弄混,希望通过本文,你能够有一个清楚的认识。
   (1)一维数组与指针
    首先我们看一下下面的例子:
  char a[10], *p;
  p=a;
    p是一个char类型的指针,它里面放的是数组a的首地址,即a[0];a这里有双重含义:地址,也可以看作是常量指针;结构,里面包含了10个char元素。
    在这种情况下,指针可以完成数组的操作,例如,对于数组的访问,可以用指针进行,也可以想数组一样对数组单元赋值和取址。但是数组不能看做普通指针,应该理解成一个固定的地址,她是在编译期间确定的,也可以理解成常量指针。
    但是,由于数组名的双重含义,决定了他自己的特性,不信请看下面的程序:
 #include <iostream>
 #include <stdlib.h>
 using namespace std;

 int main(int argc, char *argv[])
 {
    int a[10]={1,2,3,4,5,6,7,8,9,10}, *p;
    p=a;

    cout<<a<<endl;
    cout<<&a<<endl;
    cout<<&a[0]<<endl;

    cout<<p<<endl;
    cout<<&p<<endl;
    cout<<&p[0]<<endl;

            system("PAUSE"); 
            return 0;
 }
    我们看到a, &a , &a[0]输出的结果都是一致的,他们都是数组的首地址,这里a体现的是指针的特性,&a则体现了结构的特性。但是对于p来讲就不一样了,因为指针p在开始的时候开辟了一块自己的内存空间,经过p=a后,p里面放的是数组a的首地址,所以p和&p[0]结果都是数组a的首地址,但是&p则是指针p本身的内存地址。
    那么一维数组究竟是什么含义呢?
    实际上,一维数组应该理解成一个线性表,他在内存中开辟了一块连续的内存空间。在对数组访问的时候,实际上,编译器做了一定的转换工作:数组名(数组的起始地址)加上相对于起始地址的相对量(由下标变量给出),得到要访问的数组元素的单元地址,然后再对计算出的单元地址的内容进行访问。例如a[3]被转换成*(a+3)。
    由于数组是在编译期间确定,代表的是一块固定的内存空间,所以数组是不能够改变的,即a++,++a,a--,--a,a+=3,a-=3等都是不允许的,但是指针p做这些动作是毫无问题的。
    在内存中,指针的分配只是占用了4个字节的空间(不要考虑16位等其他情况,毕竟最常见的是32位的,嗯,好吧,我们随后就谈谈这方面的问题),但是对于数组就不同了,它除了要分配自己的内存单元,还要保存一些信息去存储它的元素的个数。从理论上来讲,编译器可以采用任何技术,但是在实际的编译器上,一般采用2种比较流行的手法:关联手法、Cookie策略。
    关联手法,就是分配一个static数组,有编译器去控制,里面放上一个map,关键字可以采用数组名+有效区间,值则可以是元素个数,释放数组内存空间的时候,就去搜索相应的map,看起来这是一个比较安全的策略,但是也比较的慢。
    Cookie策略,也称过渡分配技术,没进行一次数组空间分配的时候,就在数组前面的某个位置加上一个sizeof(size_t)字节的空间,来存放数组的元素个数。这个策略毫无疑问很快,但是不够安全,有的时候,我们可以取到Cookie的值,并进行修改,这样一来就可以破坏堆栈空间。
    不过,这里有一个例外,在数组被当作参数传递的时候,数组会被自动将为普通指针,这样做的好处也很明显:提高效率。你可以想象,如果不当作指针传递,那么元素的传递将是一笔大的开销。
    指针还有一个很要命的问题,那就是指针的对齐问题。
    当你在80x86处理器上执行你的程序时,这个问题不是致命的,但对其他的绝大多数芯片来说,这就是致命的了。它还会对你的应用程序移植到某个其他环境的能力产生影响。此外,甚至对于Intel 处理器来说,这个问题也许不是致命的,但是她会占用CPU更多的时间进行转换,毫无疑问的导致性能的下降。
    当你的指针从一种类型转换到另一种类型的时候,就有可能产生一个非对准指针(misaligned pointer)。处理器一般要求内存块的地址要与一个和这个内存块的尺寸匹配的边界对齐。例如,字只能在字边界上被访问(地址是二的倍数),双字只能在双字边界上被访问(地址是四的倍数),依次类推。
    编译器通常确保监视这个规则。但是当你的指针类型从一种类型转换成较大类型时,你就可以很容易地违反这个规则:
      char cA;
      char* pC = &cA;
      int* pI;
      pI = (int*)pC;
      *pI = 0;
    因为字符仅仅是一个字节长,所以地址&cA可能有任意值,包括奇数值。可是,pI应只包含四的倍数的地址。通过转换,允许把pC赋给pI,但是如果地址不是四的倍数,则接着发生的赋值可能使程序崩溃。
   不过,这种情况只在你正在把你的指针从指向一种类型转换成指向较大类型时才会出现。    

    未完(待续...)


原文转自:http://www.ltesting.net