您的位置:首页 > 文旅 > 美景 > C语言自定义类型结构体(24)

C语言自定义类型结构体(24)

2025/1/9 12:02:03 来源:https://blog.csdn.net/2301_80392199/article/details/142287082  浏览:    关键词:C语言自定义类型结构体(24)

文章目录

  • 前言
  • 一、结构体类型的声明
    • 结构体回顾
    • 结构体的特殊声明
    • 结构体的自引用
  • 二、结构体的内存对齐
    • 对齐规则
    • 为什么存在内存对齐?
    • 修改默认对齐数
  • 三、结构体传参
  • 四、结构体实现位段
    • 什么是位段
    • 位段的内存分配
    • 位段的跨平台问题
    • 位段的应用
    • 位段使用的注意事项
  • 总结


前言

  事实上,我们早就有过关于结构体的学习
  现在,我们再来深入理解它一下


一、结构体类型的声明

结构体回顾

  结构是一些值的集合,这些值称为成员变量,结构的每个成员可以是不同类型的变量

结构的声明

struct tag
{
  member-list;
}variable-list;

例如,我们想要描述一位学生:

struct Stu
{
  char name[20]; // 名字
  int age; // 年龄
  char sex[5]; // 性别
  char id[20]; // 学号
}; // 分号不能丢

结构体变量的创建和初始化
  运用大括号 { } 即可,在其里面进行初始化
  可以按照默认顺序初始化,也可以按照指定顺序初始化
  struct Stu s1 = {.age = 30, .name = “Lisi”, .sex = “nv”, .id = “2023020405”};

结构体的特殊声明

在声明结构的时候,可以不完全的声明

// 匿名结构体类型
// 只能使用一次
struct
{int a;char b;float c;
}x;struct
{int a;char b;float c;
}a[20], *p;

我们可以思考一下,对于上面两个结构体, p = &x; 这样的语句对不对

答案是不对的,虽然两个结构体成员相同,但是因为是匿名的,在编译器看来是两种不同的类型
在这里插入图片描述

大部分情况下我们不会用到匿名结构体的,你在使用的时候也需要注意一下

结构体的自引用

  在结构中包含一个类型为该结构本身的成员是否可以呢?
  可以,我们之后学数据结构的链表就是如此,请持续关注我的博客!

在结构体自引用使用的过程中,夹杂了 typedef 对匿名结构体类型重命名,也容易引入问题

typedef struct
{int data;Node* next; // err
}Node;

答案是不行的,因为Node是对前面的匿名结构体类型的重命名产生的,但是在匿名结构体内部提前使用Node类型来创建成员变量,这是不行的,一言以蔽之就是,你提前使用了重命名类型

二、结构体的内存对齐

  现在我们要来深入探讨一个问题:结构体的大小计算
  其实也就是知识点 -> 内存对齐

先让你诧异一下,哈哈,就拿这两个输出作为引子吧!
在这里插入图片描述

对齐规则

结构体的对齐规则:

  1. 结构体的第一个成员对齐到和结构体变量起始位置偏移量为0的地址处
  2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处
  3. 对齐数 = 编译器默认的一个对齐数 与 该变量成员大小的较小值
    - VS中默认的值为8
    - Linux中gcc没有默认对齐数,对齐数就是成员自身的大小
  4. 结构体总大小为最大对齐数(结构体中每个成员变量都有一个对齐数,所有对齐数当中最大的)整数倍
  5. 如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍
struct S1
{char c1; // 1Bytechar c2; // 1Byteint i; // 4Bytes
}

  我们会发现,起始c1放在偏移量为 0 的位置上,c2放在偏移量为1的位置上,而 int 占 4 个字节,取较小值得到对齐数是 4 ,对齐到 4 的整数倍的位置 4 上,并占 4 5 6 7 这四个位置,并且算下来整个结构体占据了 8 个字节,是最大对齐数 4 的整数倍,所以结构体的总大小为 8 ,浪费了 2 个字节的空间,图示如下:
在这里插入图片描述

我们再来看S2

struct S2
{char c1; // 1Byteint i; // 4Byteschar c2; // 1Byte
}

  c1先放在偏移量为 0 的位置上,而 int 占 4 个字节,对齐到整数位置 4 上,并占 4 5 6 7四个位置,而c2占在偏移量为8的位置上,这时候结构体的最大对齐数是4,而结构体的大小为0 ~ 8,为9,不是4的整数倍,因此还要再来 3 个字节,也就是 0 ~ 11,最终,会发现结构体的大小为 12 ,这其中就浪费了 6 个字节的内存空间,图示如下:
在这里插入图片描述

接下来我再给出一个例子,你用做练习自己分析吧

struct S3
{double d; // 0 ~ 7char c; // 8int i; // 12 ~ 15
};

答案是16个字节

那再来个嵌套结构体的:

struct S4
{char c1;struct S3 s3;double d;
};

  首先c1放在偏移量为0的位置上,而s3是个结构体,按照上述第五条规则,应该对齐到结构体成员中最大对齐数8的整数倍位置上,显然s3放在8上,并占 8 ~ 23位置,(s3大小为16,前面求过),这时候double放到对齐数8的整数倍上,刚好24满足,并占24~31位置,这样的话,S4大小为32,恰好也满足了所有成员中对齐数的整数倍这一必要性条件,浪费7个字节,图示如下:
在这里插入图片描述

如果你要验证,可以自己去写输出部分验证,或者可以打开内存监视
亦或者,有一个宏 offsetof ,可以用来计算结构体成员相较于起始位置的偏移量
需要注意的是,这个宏需要包含一个头文件 stddef.h
在这里插入图片描述

为什么存在内存对齐?

  1. 平台原因(移植原因)
    不是所有的硬件平台都能够访问任意地址上的任意数据;某些硬件平台只能在某些地址处获取某些特定类型的数据,否则则出现硬件异常
  2. 性能原因:
    数据结构(尤其是栈)应该尽量地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要两次内存访问,而对齐的内存访问只需要一次访问。假设一个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证所有的double类型的数据都在对齐的地址中,那么就可以用一个内存操作来读取者写值了。否则,我们可能需要进行两次内存访问,因为对象可能分散在两个8字节内存块中。
    按图来说的话,性能原因如下:
    在这里插入图片描述

总而言之:结构体的内存对齐是拿空间来换时间的一种做法

所以在设计结构体的时候,我们既要满足对齐,又要节省空间的话,可以考虑将占用内存小的成员尽量集中在一起
比如上述的 S1 和 S2 结构体,S1 设计的就比 S2 好

修改默认对齐数

#pragma 这个预处理指令,可以改变编译器的默认对齐数

#include <stdio.h>  
#pragma pack(1) //设置默认对齐方式为1  
struct S  
{  char c1;  int i;  char c2;  
};  
#pragma pack() //取消设置的对齐,恢复默认  
int main()  
{  //输出的结果是什么?  printf("%d\n", sizeof(struct S));  return 0;  
}

答案是6,自行分析
当我们觉得对齐方式不合理的时候,我们可以自己更改默认对齐数

三、结构体传参

#include <stdio.h>struct S
{int data[1000];int num;
};struct S s = { {1,2,3,4}, 1000 };
//结构体传参  
void print1(struct S s)
{printf("%d\n", s.num);
}//结构体地址传参  
void print2(struct S* ps)
{printf("%d\n", ps->num);
}int main()
{print1(s); //传结构体  print2(&s); //传地址  return 0;
}

  上面 printf1 和 printf2 函数哪个好些?
  printf2的方式更好一些,也就是说传地址方式更好一些,本质上还是因为形参是实参的一份拷贝,太浪费内存空间了

四、结构体实现位段

  你可能只听说过段位,没事,现在我来跟你讲一下位段
  没听过很正常,这个知识点比较细致,但是对于了解底层以及未来网络的学习还是很有用的

什么是位段

 位段的声明和结构是类似的,有两个不同:

  1. 位段的成员必须是int、unsigned int或 signed int,在C99中位段成员的类型也可以选择其他类型
  2. 位段的成员名后边有一个冒号和一个数字
struct A
{int _a:2;int _b:5;int _c:10;int _d:30;
}// A就是一个位段类型

那么位段A所占内存的大小是多少?
在这里插入图片描述

为什么不是按照前面讲述的内存对齐,是16反而是8?

位段的内存分配

位段的出现就是为了节省空间

  1. 位段的成员可以是 int、unsigned int、signed int 或者是 char 等类型。
  2. 位段的空间上是按照需要以 4 个字节(int)或者 1 个字节(char)的方式来开辟的。
  3. 位段有很多不确定因素,位段是不跨平台的,注意可移植的程序应避免使用位段。(比如说一个字节从左向右还是从右向左使用?)

假设从右向左,来个例子如下:
在这里插入图片描述
  _a给两个比特位,_b给5个比特位,_c给10个比特位,_d给30个比特位
  _a、_b、_c没什么好说的,但是这个_d就有两种存储方式了,是直接弃掉第一个 int 剩下的15个比特位,新开一个 int 用30个比特位存_d ;还是继续使用完这15个比特位,再新开个 int 用15个存_d,其实,C语言也没有规定,完全取决于编译器,哈哈,这又是不确定性

VS下其实是从右向左存储,如果剩余的空间不够下一个成员使用,就新开空间并浪费
我们来通过下面这段代码来进行验证:

#include <stdio.h>struct S
{// char就好在是一个字节一个字节开辟char a : 3;char b : 4;char c : 5;char d : 4;
};int main()
{struct S s = { 0 };s.a = 10;s.b = 12;s.c = 3;s.d = 4;printf("%zd", sizeof(struct S)); // 3return 0;
}

首先,a 和 b共占用了7个比特位,剩下1个比特位不够 c ,于是新开一个字节放 c,同理再新开一个字节放 d
在这里插入图片描述
接下来我们给 a 赋值为 10,即1010,截断后三位,放入010,同理b放入1100

这时候,第一个字节的8个比特位就是01100010

同理c放入00011

这时候,第二个字节的8个比特位就是00000011

同理d放入0100

这时候,第三个字节的8个比特位就是00000100

那么,按照十六进制位,这三个字节就是分别就是 0x62、0x03、0x04,打开内存!
在这里插入图片描述

果然如此!!

位段的跨平台问题

  1. int 位段被当成有符号数还是无符号数是不确定的
  2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。)
  3. 位段中的成员在存储中有右分配,还是从右向左分配标准尚未定义。
  4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位置,是含有剩余的位置是利用,这是不确定的。

位段的应用

  同开头所说,位段在于网络传输部分还是用处蛮大的
  这个自行了解,我也是现查的,具体原理大家自辨

位段使用的注意事项

  位段的几个成员共享同一个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位段处是没有地址的。内存中每个字节分配一个地址,一个字节内部的bit位是没有地址的。

  所以不能对位段的成员使用&操作符,这样就不能使用scanf直接给位段的成员输入值,只能是先输入放在一个变量中,然后赋值给位段的成员。

struct A  
{  int _a : 2;  int _b : 5;  int _c : 10;  int _d : 30;  
};  int main()  
{  struct A sa = {0};  scanf("%d", &sa._b); // error// right int b = 0;  scanf("%d", &b);  sa._b = b;  return 0;  
}

总结

  我也没想到结构体深入了解竟然能讲出那么多东西来,哈哈
  本篇还是比较难的,请你和我好好消化一下,准备接下来的学习~

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com