算法与数据结构——空间复杂度

空间复杂度

空间复杂度（space complexity）用于衡量算法占用内存空间随着数据量变大时的增长趋势。这个概念与时间复杂度非常类似，只需将“运行时间”替换为“占用内存空间”。

算法相关空间

算法在运行过程中使用的内存空间主要包括以下几种。

输入空间：用于存储算法的输入数据。
暂存空间：用于存储算法在运行过程中的变量、对象、函数上下文等数据。
输出空间：用于存储算法的输出数据。

一般情况下，空间复杂度的统计范围是“暂存空间”加上“输出空间”。

暂存空间可以进一步划分为三个部分。

暂存数据：用于保存算法运行过程中的各种常量、变量、对象等。
栈帧空间：用于保存调用函数的上下文数据。系统在每次调用函数时都会在栈顶部创建一个栈帧，函数返回后，栈帧空间会被释放。
指令空间：用于保存编译后的程序指令，在实际统计中通常忽略不计。

在分析一段程序的空间复杂度时，我们通常统计暂存数据、栈帧空间和输出数据三部分。

推算方法

空间复杂度的推算方法与时间复杂度大致相同，只需将统计对象从“操作数量”转为“使用空间大小”。
而与时间复杂度不同的是，我们通常只关注最差空间复杂度。这是因为内存空间是一项硬性要求，我们必须确保在所有输入数据下都有足够的内存空间预留。
观察以下代码，最差空间复杂度中的“最差”有两层含义。

以最差输入数据为准：当 𝑛 < 10 时，空间复杂度为 𝑂(1) ；但当 𝑛 > 10 时，初始化的数组 nums 占用 𝑂(𝑛) 空间，因此最差空间复杂度为 𝑂(𝑛) 。
以算法运行中的峰值内存为准：例如，程序在执行最后一行之前，占用 𝑂(1) 空间；当初始化数组 nums时，程序占用 𝑂(𝑛) 空间，因此最差空间复杂度为 𝑂(𝑛) 。

void algorithm(int n) {
	int a = 0; // O(1)
	vector<int> b(10000); // O(1)
	if (n > 10)
		vector<int> nums(n); // O(n)
}

在递归函数中，需要注意统计栈帧空间。

int func() {
	// 执行某些操作
	return 0;
}
/* 循环的空间复杂度为 O(1) */
void loop(int n) {
	for (int i = 0; i < n; i++) {
		func();
	}
}
/* 递归的空间复杂度为 O(n) */
void recur(int n) {
	if (n == 1) return;
	return recur(n - 1);
}

函数loop()和recur()的时间复杂度都为 𝑂(𝑛) ，但空间复杂度不同。

函数loop()在循环中调用了n次function()，每轮的function()都返回并释放了栈帧空间，因此空间复杂度仍为𝑂(1)。
递归函数recur()在运行过程中会存在n个未返回的recur()，从而占用 𝑂(𝑛) 的栈帧空间。

常见类型

设输入数据大小为n，如图展示了常见的空间复杂度类型

常数阶𝑂(1)

常数阶常见于数量与输入数据大小n无关的常量、变量、对象。

需要注意的是，在循环中初始化变量或调用函数而占用的内存，在进入下一循环后就会被释放，因此不会积累占用空间，空间复杂度仍为𝑂(1)。

/* 函数 */
int func() {
	// 执行某些操作
	return 0;
}
/* 常数阶 */
void constant(int n) {
	// 常量、变量、对象占用 O(1) 空间
	const int a = 0;
	int b = 0;
	vector<int> nums(10000);
	ListNode node(0);
	// 循环中的变量占用 O(1) 空间
	for (int i = 0; i < n; i++) {
		int c = 0;
	}
	// 循环中的函数占用 O(1) 空间
	for (int i = 0; i < n; i++) {
		func();
	}
}

线性阶𝑂(n)

线性阶常见于元素数量与n成正比的数组、链表、栈、队列等以及递归深度为n的递归函数：

/* 线性阶 */
void linear(int n) {
	// 长度为 n 的数组占用 O(n) 空间
	vector<int> nums(n);
	// 长度为 n 的列表占用 O(n) 空间
	vector<ListNode> nodes;
	for (int i = 0; i < n; i++) {
		nodes.push_back(ListNode(i));
	}
	// 长度为 n 的哈希表占用 O(n) 空间
	unordered_map<int, string> map;
	for (int i = 0; i < n; i++) {
		map[i] = to_string(i);
	}
}

平方阶𝑂(n²)

平方阶常见于矩阵和图，元素数量与n成平方关系：

/* 平方阶 */
void quadratic(int n) {
	// 二维列表占用 O(n^2) 空间
	vector<vector<int>> numMatrix;
	for (int i = 0; i < n; i++) {
		vector<int> tmp;
		for (int j = 0; j < n; j++) {
			tmp.push_back(0);
		}
		numMatrix.push_back(tmp);
	}
}

指数阶𝑂(2ⁿ)

指数阶常见于二叉树，层数为n的“满二叉树”的节点数量为2ⁿ - 1，占用 𝑂(2𝑛) 空间：

/* 指数阶（建立满二叉树） */
TreeNode *buildTree(int n) {
	if (n == 0)
		return nullptr;
	TreeNode *root = new TreeNode(0);
	root->left = buildTree(n - 1);
	root->right = buildTree(n - 1);
	return root;
}

对数阶𝑂(logn)

对数阶常见于分治算法。例如归并排序，输入长度为n的数组，每轮递归将数组从中点处划分为两半，形成一个高度为logn的递归树，使用 𝑂(log 𝑛) 栈帧空间。

再例如将数字转化为字符串，输入一个正整数n，它的位数是⌊log₁₀ 𝑛⌋ + 1，即对应字符串长度为⌊log₁₀𝑛⌋ + 1，因此空间复杂度为𝑂(log₁₀ 𝑛 + 1) = 𝑂(log 𝑛) 。

权衡时间与空间

降低时间复杂度通常需要以提升空间复杂度为代价，反之亦然。在大多数情况下，时间比空间更宝贵，因此“以空间换时间”通常是更常用的策略。

posted @ 2024-08-19 17:28 风陵南阅读(114) 评论(0) 收藏举报

刷新页面返回顶部

风陵南