C++内存管理

在这里插入图片描述

C/C++内存分布

我们的内存区域是要进行划分的。

电脑上有哪些核心资源？CPU（GPU也是一种特殊的CPU）、内存、磁盘。

程序运行本质是把写好的程序编译成指令。操作系统就像一个工厂，进程就像里面的机器人或工人，需要干活，我们的代码以进程的角度运行。我们需要给进程分配资源和原料。

在电脑的任务管理器就可以看到进程。

C/C++是以什么样的方式给它们分配内存的呢？

程序运行本质上就是处理各种数据，执行各种指令，得到一个结果。我们写的程序中不同的数据要存储在不同的阶段。局部数据如函数调用建立栈帧，用一会就销毁了；或者需要长期允许的，全局数据和静态数据；还有不修改的常量数据；还有需要动态申请的数据。

每个进程都有虚拟进程地址空间，然后要通过页表，跟物理内存进行映射。

进程执行其实就是从代码段上依次去取指令放到CPU上执行。

……

栈又叫堆栈–非静态局部变量/函数参数/返回值等等，栈是向下增长的。
内存映射段是高效的I/O映射方式，用于装载一个共享的动态内存库。用户可使用系统接口创建共享共享内存，做进程间通信。
堆用于程序运行时动态内存分配，堆是可以上增长的。
数据段–存储全局数据和静态数据。
代码段–可执行的代码/只读常量。

题目

现在我们可以通过题目来巩固一下内存管理的知识：

这就是我们平时会遇到的一些数据，清楚它们存放的段是很重要的。

第一组：

第一个是全局变量，所以在数据段（静态区）。

第二个是全局静态变量，放在数据段。

第三个是局部静态，也在数据段。

第四个是静态变量，在栈。

第五个，数组名代表整个数组，是局部数组，所以在栈。

第二组：

第一个char2是一个数组，在栈。

第二个*char2代表首元素。我们分析一下char char2[]="abcd";，意思是在栈上开了5字节的数组，然后把a b c d \0字符拷贝过来放到内存中（严格来说存的是ASCII码）。所以首元素是’a’。所以char在栈上。

数组名，sizeof(数组名)的时候，是代表整个数组。进行运算的时候，是首元素地址。

第三个，pChar3是一个字符指针，本身也是局部变量，在栈上。

第四个，pChar3指向的是常量字符串，常量字符串放在常量区也就是代码段，所以*pChar3是首元素，也就在代码段上。

第五个，ptr1也是栈上一个指针变量，占4个字节，指向堆上开的一块空间。

第六个，*ptr1就在堆上。

char2是一个数组，pChar3是一个指针，一定要注意区分。

局部变量都是在栈上的，因为函数调用会建立栈帧，局部变量都存在这个栈帧里，函数结束也就跟着销毁。

其实我们自己要管的是堆上的数据。

C语言中动态内存管理方式：malloc/calloc/realloc/free

void Test ()
{// 1.malloc/calloc/realloc的区别是什么？int* p2 = (int*)calloc(4, sizeof (int));int* p3 = (int*)realloc(p2, sizeof(int)*10);// 这里需要free(p2)吗？free(p3 );
}
//答案：这里不需要free(p2)。realloc是原地或者异地扩容，如果空间足够原地扩容，那么释放p3也就把p2释放了；如果是异地扩容，它会把p2先释放掉。也不需要管。

malloc/calloc/realloc的区别？

calloc相当于malloc+memset，也就是要初始化。realloc主要是扩容。
malloc的实现原理？这里不说了。

C++内存管理方式

C语言内存管理方式在C++中可以继续使用，但有些地方就无能为力，而且使用起来比较麻烦，因此C++又提出了自己的内存管理方式：

通过new和delete操作符进行动态内存管理。

new是一个关键字，不是一个函数，new后面直接跟类型就可以申请对象。

//申请一个int类型的对象：
int main()
{int* p1 = new int;//不需要类型强转、计算大小int* p2 = new int[10];delete p1;delete[] p2;//要匹配//申请对象+初始化int* p3 = new int(1);int* p4 = new int[10]{0};//全部初始化为0int* p5 = new int[10]{1,2,3,4,5};//初始化前5个delete p3;delete[] p4;delete[] p5;return 0;
}

C++弄出new，只是为了使用更方便吗？

回答这个问题之前，这前面我们看的都是内置类型，现在我们来看自定义类型。

int main()
{A* p1 = new A;A* p2 = new A(1);delete p1;delete p2;return 0;
}

可以看到，我们用new和delete的时候，C++对于自定义类型，自己去调用了构造函数和析构函数。这才是真正的区别。

那么，我们就会有一个疑问，自己去调用构造函数和析构函数，真的这么重要吗？

我们回忆一下链表结点，在C语言中，申请一个新的链表我们一般调用已经写好的BuyNode函数，而在C++中，struct升级成为了类，也就是说有了构造函数。

struct ListNode
{int val;ListNode* next;ListNode(int x):val(x),next(nullptr){}
};int main()
{return 0;
}

那么现在我们要得到一个新的结点，可以看到，这个构造函数干的事情基本上就是我们原来BuyNode干的事。

我们可以快速得到一个链表：

struct ListNode
{int val;ListNode* next;ListNode(int x):val(x),next(nullptr){}
};int main()
{ListNode* n1 = new ListNode(1);ListNode* n2 = new ListNode(1);ListNode* n3 = new ListNode(1);ListNode* n4 = new ListNode(1);n1->next = n2;n1->next = n3;n1->next = n4;return 0;
}

new一个结点的时候我们不仅申请了空间，还调用了构造函数进行初始化。而malloc只开空间无法做到开空间时同时初始化。

我们再看这个场景：

没有默认构造了

class A
{
public:A(int a1,int a2 = 0)//现在没有默认构造了:_a1(a1),_a2(a2){cout << "A(int a1 = 0,int a2 = 0)" << endl;}private:int _a1 = 1;int _a2 = 1;
};struct ListNode
{int val;ListNode* next;ListNode(int x):val(x),next(nullptr){}
};int main()
{A* p1 = new A(1);A* p2 = new A(2,2);//创建并初始化一个A类型数组——有名对象写法A aa1(1, 1);A aa2(2, 2);A aa3(3, 3);A* p3 = new A[3]{ aa1,aa2,aa3 };//严格来说调用的是拷贝构造而不是构造了，因为这三个有名对象是已存在的//匿名对象写法A* p4 = new A[3]{ A(1,1),A(2,2),A(3,3) };//构造匿名对象再去拷贝构造，编译器会进行优化。return 0;
}

在上一句有名对象的三次拷贝构造结束后，可以看到只进行了三次直接的构造，并没有再拷贝构造。

这只是第二种写法，其实还有第三种写法：

int main()
{A aa1(1, 1);A aa2(2, 2);A aa3(3, 3);	//有名对象A* p3 = new A[3]{ aa1,aa2,aa3 };//匿名对象A* p4 = new A[3]{ A(1,1),A(2,2),A(3,3) };//隐式类型转换写法A* p5 = new A[3]{ {1,1},{2,2},{3,3} };return 0;
}

我们之前就说过，单参数构造函数支持隐式类型转换，多参数构造函数在C++11之后也支持隐式类型转换，需要用一个花括号括起来。

我们可以再深入梳理一下，第一种就是构造有名对象去拷贝构造数组；第二种是构造匿名对象去拷贝构造数组，但是编译器优化成 ;第三种本质上其实和第二种还是一样的：先构造临时对象，再去拷贝构造数组。编译器优化后第三种也是直接构造。

同时，也再次体现了默认构造函数的重要性。

这些各种括号的不同使用场景，要理解。

从此以后，一般情况下，不管是内置类型还是自定义类型需要申请内存，我们不再使用malloc而是使用new和delete。

申请资源失败

还有一个问题，以前malloc失败了我们需要检查。现在怎么不检查了呢？

其实是因为我们改用抛异常了。

我们malloc失败，返回的是空，而new失败返回的不是空。所以检查返回值是没用的。

日常中，动态开辟内存基本不会失败，所以我们一般不去管。

1M（兆）约等于100wByte。1G约等于10亿Byte。

$1 TB = 1024 GB$

$1 G = 1024 MB = 1024✕1024 K B = 1024✕1024✕1024 B y t e$

int main()
{void* p1 = new char[1024 * 1024 * 1024];cout << p1 << endl;void* p2 = new char[1024 * 1024 * 1024];cout << p2 << endl;void* p3 = new char[1024 * 1024 * 1024];cout << p3 << endl;return 0;
}

可以看到，程序终止了。

我们这里其实是一次就申请了一个G，在申请第二个G的时候就出错了。

这是一种捕获异常的写法。

还有一种：

那么我们现在看一下能申请多少兆的空间：

32位下，最多能在堆上申请1897兆，不到2G内存。现在申请的是虚拟内存。32位的进程地址空间都是4G，而实际内存条是16G。这之间存在虚拟内存和物理内存的映射。

64位的虚拟空间非常大，大概是42亿乘4G，一百六十多亿G。 $2^{64}$ 。 $2^{32}$ 是4G

回到我们刚才的程序，32位下4G的虚拟内存，堆就已经给了将近2G，已经很大了。

32位程序指的到底是什么？

我们平时说的指针，本质是一个编号。空指针也是有编号的，对应第0个字节。一个字节对应一个编号，有 $2^{32}$ 个字节，对应 $2^{32}$ 个编号。 $2^{30}$ 是1G，所以 $2^{32}$ 是4G。32位下的指针是4字节，因为4字节的编号就能从00000000存到FFFFFFFF

64位下的地址从0000000000000000到FFFFFFFFFFFFFFFF,需要8个字节来存这个编号。64位下内存的各个区域都会大很多。大概整个空间有160亿G。因为 $2^{64}$ 不是 $2^{32}$ 的两倍，而是 $2^{32}$ 倍。42亿乘4G。

那么我们把刚才写的程序切换到64位环境运行一下：

void func()
{int n = 1;while (1){void* p1 = new char[1024*1024 * 1024];cout << p1 << "->" << n << endl;++n;}
}int main()
{try{func();}catch (const exception& e){cout << e.what() << endl;}return 0;
}

申请了48G空间左右。

如果更深去了解，160多亿G其实留了一部分没有用，因为实在太大了。

申请的是虚拟内存。会分块进行映射。当然这都是简单的说法，只是提一嘴。

一般情况下，32位下的线程，栈只分配8M，800w字节；堆是1.8G左右。所以递归深度太深栈会溢出。所以数据量很大的时候要去堆上申请，而不能借助栈。除了递归不要太深外，在栈上也不要定义大数组。

new和delete的底层原理

new和delete是用户进行动态内存申请和释放的操作符，operator new 和operator delete是系统提供的全局函数，new在底层调用operator new全局函数来申请空间，delete在底层通过operator delete全局函数来释放空间。

/*
operator new：该函数实际通过malloc来申请空间，当malloc申请空间成功时直接返回；申请空间失败，尝试执行空间不足应对措施，如果该应对措施用户设置了，则继续申请，否则抛异常。
*/
void *__CRTDECL operator new(size_t size) _THROW1(_STD bad_alloc)
{// try to allocate size bytesvoid *p;while ((p = malloc(size)) == 0)if (_callnewh(size) == 0){// report no memory// 如果申请内存失败了，这里会抛出bad_alloc 类型异常static const std::bad_alloc nomem;_RAISE(nomem);}return (p);
}/*
operator delete: 该函数最终是通过free来释放空间的*/void operator delete(void *pUserData)
{_CrtMemBlockHeader * pHead;RTCCALLBACK(_RTC_Free_hook, (pUserData, 0));if (pUserData == NULL)return;_mlock(_HEAP_LOCK);  /* block other threads */__TRY/* get a pointer to memory block header */pHead = pHdr(pUserData);/* verify block type */_ASSERTE(_BLOCK_TYPE_IS_VALID(pHead->nBlockUse));_free_dbg( pUserData, pHead->nBlockUse );__FINALLY_munlock(_HEAP_LOCK);  /* release other threads */__END_TRY_FINALLYreturn;
}/*
free的实现
*/
#define   free(p)               _free_dbg(p, _NORMAL_BLOCK)

里面有很多我们暂且看不明白的内容，但是总的来说，operator new和operator delete调用的就是malloc和free。

operator new和operator delete与new和delete的关系是什么呢？

new由两部分构成，一部分是开空间，一部分是调用构造函数。

new的原理

调用operator new函数申请空间
在申请的空间上执行构造函数，完成对象的构造

为什么要弄出一个operator new（披着马甲的malloc）而不是直接用malloc呢？因为我们知道malloc申请失败直接就返回空了，而C++期望的是申请失败后走抛异常的机制，所以用operator new给malloc套了一个马甲。

对于内置类型，new直接调用operator new申请空间就行了，对于自定义类型，还会去执行构造函数。

我们看一下编译后生成的指令：

看看反汇编：

可以看到编译器做了两件事，申请空间和调用构造函数。

再看看delete：

int main()
{A* p1 = new A(1);delete p1;return 0;
}

delete的原理
1. 在空间上执行析构函数，完成对象中资源的清理工作
2. 调用operator delete函数释放对象的空间
new T[N]的原理
1. 调用operator new[]函数，在operator new[]中实际调用operator new函数完成N个对象空间的申请
2. 在申请的空间上执行N次构造函数
delete[]的原理
1. 在释放的对象空间上执行N次析构函数，完成N个对象中资源的清理
2. 调用**operator delete[]**释放空间，实际在operator delete[]中调用operator delete来释放空间

看看这段代码：

int main()
{A* p1 = new A(1);delete p1;A* p2 = new A[5];delete[] p2;return 0;
}

可以看到，对于A* p2 = new A[5];我们调用了5次构造和5次析构。

错配

int main()
{int* p1 = new int;free(p1);return 0;
}

像这样，我们去错配，会发生什么呢？

并没有崩溃。（内存泄漏是不会报错的）

这里有内存泄漏吗？没有。这里是内置类型。

但是不要这样去乱写。

那现在如果是自定义类型呢？

也没有崩溃。但是比起delete，其实少调用了一个A的析构函数：

如果A的析构函数没做什么事还好，如果在里面释放一些资源，那么就会因为没有调用到析构函数而内存泄漏。

再看：

这里没有正确使用delete[]，漏写[]

没有崩溃，其实也不会有内存泄漏。

这里内置类型没有构造函数析构函数，new去调用operator new，operator new调用malloc，最本质的还是malloc来一块空间。

delete去调用operator delete，然后调用free，本质也是free。

所以空间不涉及构造和析构时，还是malloc和free。空间的申请和释放最终还是malloc和free解决的。

自定义类型：

可以看到也没有问题。

但是这样，却崩溃了。

A和B根据内存对齐，都是8字节。

10个A对象是84字节，10个B对象却是80。

编译器遇到A这种类型，会在头上多开4个字节，用来存储对象个数。

这个程序在不同编译器下可能情况不同。

new A的时候我们返回的不是malloc起始的位置：

所以我们delete的时候要往前偏移4字节才对。释放空间不能在中间释放。

那么为什么A要多开4字节呢？严格来说都应该开4字节存个数。B没有开是因为编译器进行了优化。因为编译器看到B没有写析构函数，不需要知道要析构几次。编译器看到B没有析构函数也不需要析构，自动生成的也没做什么事情，所以编译器干脆不调用析构函数了。

总之，一定要匹配使用，不要错配。

定位new表达式(placement-new)

定位new表达式是在已分配的原始内存空间中调用构造函数初始化一个对象。

int main()
{A* p1 = new A(1);//开空间并初始化A* p2 = (A*)operator new(sizeof(A));//只开了空间，没有初始化return 0;
}

如果现在想要对这块已经开好的空间去显示调用构造函数呢？定位new可以帮我们做到这一点。

可以看到，这样就也调用构造了。

那现在如果想要调用析构呢？

int main()
{A* p1 = new A(1);//开空间并初始化A* p2 = (A*)operator new(sizeof(A));//只开了空间，没有初始化new(p2)A(1);//p2->A(1);构造函数不能这样显式写，想要显示调用构造要写成上面定位new形式delete p1;p2->~A();//析构函数可以这样显式写return 0;
}

int main()
{A* p1 = new A(1);//开空间并初始化delete p1;A* p2 = (A*)operator new(sizeof(A));//只开了空间，没有初始化new(p2)A(1);//定位new，显式构造p2->~A();//析构函数可以这样显式写operator delete(p2);return 0;
}

其实上面p1和p2的效果是一样的，失败了都是抛异常。

但是两行就写好了更方便，后面这种写法很冗余。

但是在很少数的情况下会需要后面这种写法：

这涉及到池化技术：内存池，线程池，连接池……。

当我们需要高频地申请释放内存块时，从堆里面搞出一块专供的内存池，效率就会比较高。（具体细节现在无法多说）

int main()
{Type* p2 = new Type;Type* p1 = pool.Alloc(sizeof(Type));new(p1)Type;return 0;
}

但是当我们向内存池申请空间时只有空间，没有初始化，但是又想达到和new一样的功能，所以就得去调用。

所以是这样的场景有需求。以后再说。

现在我们的系统都是多核的，CPU是多少核其实就是有多少个CPU，就能支持并发执行。每次执行的时候再去创建线程，消耗很大，所以就会提前创建比如10个线程，有任务来了就直接执行，执行完了让线程再回来。连接池也一样，去连接数据库的时候不用现场去连接，减少消耗。

本文到此结束=_=

C++内存管理

C++内存管理

C/C++内存分布

题目

C语言中动态内存管理方式：malloc/calloc/realloc/free

C++内存管理方式

C++弄出new，只是为了使用更方便吗？

没有默认构造了

申请资源失败

32位程序指的到底是什么？

new和delete的底层原理

错配

自定义类型：

定位new表达式(placement-new)

最新新闻

热搜词