当前位置 博文首页 > CW_qian的博客:8月22日笔记C语言基础(补1)结构体1

    CW_qian的博客:8月22日笔记C语言基础(补1)结构体1

    作者:[db:作者] 时间:2021-08-25 21:44

    1. 结构体基本概念

    ????????C语言提供了众多的基本类型,但现实生活中的对象一般都不是单纯的整型、浮点型或字符串,而是这些基本类型的综合体。比如一个学生,典型地应该拥有学号(整型)、姓名(字符串)、分数(浮点型)、性别(枚举)等不同侧面的属性,这些所有的属性都不应该被拆分开来,而是应该组成一个整体,代表一个完整的学生。

    ????????在C语言中,可以使用结构体来将多种不同的数据类型组装起来,形成某种现实意义的自定义的变量类型。结构体本质上是一种自定义类型。

    结构体的定义:

    struct? ?结构体标签

    {

    ????成员1;

    ????成员2;

    ????...

    };

    • 语法:
      • 结构体标签,用来区分各个不同的结构体。
      • 成员,是包含在结构体内部的数据,可以是任意的数据类型。
    • 示例:

    // 定义了一种称为 struct node 的结构体类型

    struct?node

    {

    ????int?a;

    ????char?b;

    ????double?c; ?

    };

    int?main()

    {

    ????// 定义结构体变量

    ????struct?node?n;

    }

    2. 结构体初始化

    ????????结构体跟普通变量一样,涉及定义、初始化、赋值、取址、传值等等操作,这些操作绝大部分都跟普通变量别无二致,只有少数操作有些特殊性。这其实也是结构体这种组合类型的设计初衷,就是让开发者用起来比较顺手,不跟普通变量产生太多差异。

    • 结构体的定义和初始化。
      • 由于结构体内部拥有多个不同类型的成员,因此初始化采用与数组类似的列表方式。
      • 结构体的初始化有两种方式:普通初始化;指定成员初始化。
      • 为了能适应结构体类型的升级迭代,一般建议采用指定成员初始化。
    • 示例:

    // 1,普通初始化

    struct?node?n?= {100, 'x', 3.14};

    // 2,指定成员初始化

    struct?node?n?= {

    ?????????????????.a = 100, ?// 此处,小圆点.被称为成员引用符

    ?????????????????.b = 'x',

    ?????????????????.c = 3.14

    ????????????????}

    • 指定成员初始化的好处:
      • 成员初始化的次序可以改变。
      • 可以初始化一部分成员。
      • 结构体新增了成员之后初始化语句仍然可用。

    3. 结构体成员引用

    ????????结构体相当于一个集合,内部包含了众多成员,每个成员实际上都是独立的变量,都可以被独立地引用。引用结构体成员非常简单,只需要使用一个成员引用符即可:

    结构体.成员

    示例:

    n.a = 200;

    n.b = 'y';

    n.c = 2.22;

    printf("%d, %c, %lf\n", n.a, n.b, b.c);

    3. 结构体指针与数组

    ????????跟普通变量别无二致,可以定义指向结构体的指针,也可以定义结构体数组。

    • 结构体指针:

    struct?node??n?= {100, 'x', 3.14};

    struct?node?*p?= &n;

    // 以下语句都是等价的

    printf("%d\n", ??n.a);

    printf("%d\n", (*p).a);

    printf("%d\n", ?p->a); ?// 箭头 -> 是结构体指针的成员引用符

    • 结构体数组:

    struct?node?s[5];

    s[0].a = 300;

    s[0].b = 'z';

    s[0].c = 3.45;


    CPU字长

    ????????字长的概念指的是处理器在一条指令中的数据处理能力,当然这个能力还需要搭配操作系统的设定,比如常见的32位系统、64位系统,指的是在此系统环境下,处理器一次存储处理的数据可以达32位或64位。


    地址对齐

    ????????CPU字长确定之后,相当于明确了系统每次存取内存数据时的边界,以32位系统为例,32位意味着CPU每次存取都以4字节为边界,因此每4字节可以认为是CPU存取内存数据的一个单元。

    ????????如果存取的数据刚好落在所需单元数之内,那么我们就说这个数据的地址是对齐的,如果存取的数据跨越了边界,使用了超过所需单元的字节,那么我们就说这个数据的地址是未对齐的

    ????数据本身占据了8个字节,在地址未对齐的情况下,CPU需要分3次才能完整地存取完这个数据,但是在地址对齐的情况下,CPU可以分2次就能完整地存取这个数据。

    总结:
    ????????如果一个数据满足以最小单元数存放在内存中,则称它地址是对齐的,否则是未对齐的。地址对齐的含义用大白话说就是1个单元能塞得下的就不用2个;2个单元能塞得下的就不用3个。
    如果发生数据地址未对齐的情况,有些系统会直接罢工,有些系统则降低性能。


    普通变量的m值

    ????????以32位系统为例,由于CPU存取数据总是以4字节为单元,因此对于一个尺寸固定的数据而言,当它的地址满足某个数的整数倍时,就可以保证地址对齐。这个数就被称为变量的m值。
    根据具体系统的字长,和数据本身的尺寸,m值是可以很简单计算出来的。

    • 举例:

    char???c; // 由于c占1个字节,因此c不管放哪里地址都是对齐的,因此m=1

    short??s; // 由于s占2个字节,因此s地址只要是偶数就是对齐的,因此m=2

    int????i; // 由于i占4个字节,因此只要i地址满足4的倍数就是对齐的,因此m=4

    double?f; // 由于f占8个字节,因此只要f地址满足4的倍数就是对齐的,因此m=4

    printf("%p\n", &c); // &c = 1*N,即:c的地址一定满足1的整数倍

    printf("%p\n", &s); // &s = 2*N,即:s的地址一定满足2的整数倍

    printf("%p\n", &i); // &i = 4*N,即:i的地址一定满足4的整数倍

    printf("%p\n", &f); // &f = 4*N,即:f的地址一定满足4的整数倍

    • 注意,变量的m值跟变量本身的尺寸有关,但它们是两个不同的概念。

    • 手工干预变量的m值:

    char?c __attribute__((aligned(32))); // 将变量 c 的m值设置为32

    • 语法:
      • attribute 机制是GNU特定语法,属于C语言标准语法的扩展。
      • attribute 前后都是双下划线,aligned两边是双圆括号。
      • attribute 语句,出现在变量定义语句中的分号前面,变量标识符后面。
      • attribute 机制支持多种属性设置,其中 aligned 用来设置变量的 m 值属性。
      • 一个变量的 m 值只能提升,不能降低,且只能为正的2的n次幂。

    结构体的M值

    • 概念:
      • 结构体的M值,取决于其成员的m值的最大值。即:M = max{m1, m2, m3, …};
      • 结构体的和地址和尺寸,都必须等于M值的整数倍。
    • 示例:

    struct?node

    {

    ????short??a; // 尺寸=2,m值=2

    ????double?b; // 尺寸=8,m值=4

    ????char???c; // 尺寸=1,m值=1

    };

    struct?node?n; // M值 = max{2, 4, 1} = 4;

    • 以上结构体成员存储分析:
    1. 结构体的M值等于4,这意味着结构体的地址、尺寸都必须满足4的倍数。
    2. 成员a的m值等于2,但a作为结构体的首元素,必须满足M值约束,即a的地址必须是4的倍数
    3. 成员b的m值等于4,因此在a和b之间,需要填充2个字节的无效数据(一般填充0)
    4. 成员c的m值等于1,因此c紧挨在b的后面,占一个字节即可。
    5. 结构体的M值为4,因此成员c后面还需填充3个无效数据,才能将结构体尺寸凑足4的倍数。

    可移植性

    可移植指的是相同的一段数据或者代码,在不同的平台中都可以成功运行。

    • 对于数据来说,有两方面可能会导致不可移植:
      • 数据尺寸发生变化
      • 数据位置发生变化

    第一个问题,起因是基本的数据类型在不同的系统所占据的字节数不同造成的,解决办法是使用教案04讨论过的可移植性数据类型即可。本节主要讨论第二个问题。

    考虑结构体:

    struct?node

    {

    ????int8_t??a;

    ????int32_t?b;

    ????int16_t?c;

    };

    以上结构体,在不同的的平台中,成员的尺寸是固定不变的,但由于不同平台下各个成员的m值可能会发生改变,因此成员之间的相对位置可能是飘忽不定的,这对数据的可移植性提出了挑战。

    解决的办法有两种:

    • 第一,固定每一个成员的m值,也就是每个成员之间的塞入固定大小的填充物固定位置:

    struct?node

    {

    ????int8_t??a __attribute__((aligned(1))); // 将 m 值固定为1

    ????int64_t?b __attribute__((aligned(8))); // 将 m 值固定为8

    ????int16_t?c __attribute__((aligned(2))); // 将 m 值固定为2

    };

    • 第二,将结构体压实,也就是每个成员之间不留任何空隙:

    struct?node

    {

    ????int8_t??a;

    ????int64_t?b;

    ????int16_t?c;

    } __attribute__((packed));

    //__attribute__();



    cs