Acwing-搜索与图论
搜索与图论
1.深度优先遍历DFS
模板:
bool st[N]; // 标记是否用过
int h[N], ne[N];
int dfs(int u)
{
if (...) {...; return;} // 输出结果,记得加return语句(或者后边部分用else括起)
st[u] = true; // st[u] 表示点u已经被遍历过
for (int p = h[u]; p != -1; p = ne[p])
{
int v = e[p];
if (!st[v]) dfs(v);
}
st[u] = false; // 恢复现场
}
}
说明:
- 空间复杂度为O(h)O(h),对空间复杂度高的考虑DFS
- 不具备最短性
2.宽度优先搜索BFS
模板:
queue<int> q;
st[1] = true; // 表示1号点已经被遍历过
q.push(1);
while (q.size())
{
int u = q.front();
q.pop();
for (int p = h[u]; p != -1; p = ne[p])
{
int v = e[p];
if (!st[v])
{
st[v] = true; // 表示点j已经被遍历过
q.push(v);
}
}
}
}
说明:
- 如果手动实现queue,则容量一般取N * N
- BFS只适用边权为1的迷宫
3.拓扑排序
模板:
过程描述:
int d[N]; // 入度
bool topsort()
{
int hh = 0, tt = -1;
// d[i] 存储点i的入度
for (int i = 1; i <= n; i ++ )
if (!d[i])
q[ ++ tt] = i;
while (hh <= tt)
{
int t = q[hh ++ ];
for (int i = h[t]; i != -1; i = ne[i])
{
int j = e[i];
if (-- d[j] == 0)
q[ ++ tt] = j;
}
}
// 如果所有点都入队了,说明存在拓扑序列;否则不存在拓扑序列。
return tt == n - 1;
}
/* 过程可概括为
入度为0的点压入队列queue内
while quque不空
{
t=队头
枚举t的所有出边t->j
删除t->j(j入度--)
if j的入度为0
j压入队列
}
*/
说明:
- 有向无环图又称拓扑图
- 有向无环图一定至少存在一个入度为0的点(反证法 + 抽屉原理证明)
- 当循环结束后,若队列的长度为n,则拓扑排序存在
- 在添加边时,可以顺便统计入度
- 可以使用其它数据结构存储结果(例如线性表,栈等,甚至是集合)
- 时间复杂度是O ( n + m ) O(n+m)O(n+m)
4.dijkstra算法
a.朴素dijkstra算法(稠密图中常用)
模板:
int g[N][N]; // 存储每条边
int dist[N]; // 存储1号点到每个点的最短距离
bool st[N]; // 存储每个点的最短路是否已经确定
// 求1号点到n号点的最短路,如果不存在则返回-1
int dijkstra()
{
memset(dist, 0x3f, sizeof dist); // 0x3f3f3f3f作为距离的“最大值”
dist[1] = 0; // 自己到自己的距离为0
for (int i = 0; i < n - 1; i ++ ) // 执行n-1次(自己到自己的距离已经确定)
{
int t = -1; // 在还未确定最短路的点中,寻找距离最小的点
for (int j = 1; j <= n; j ++ )
if (!st[j] && (t == -1 || dist[t] > dist[j]))
t = j;
// 用t更新其他点的距离
for (int j = 1; j <= n; j ++ )
dist[j] = min(dist[j], dist[t] + g[t][j]);
st[t] = true;
}
if (dist[n] == 0x3f3f3f3f) return -1; // 不可达
return dist[n];
}
说明:
-
由于最多有105105条边,且每条边的长度不超过104104,因此最大距离不超过109109,0x3F3F3F3F比109109大一些,因此可当做距离的最大值。好处是只用一行memset(d, 0x3f, sizeof d)就能实现把d数组各值初始化为“最大值”(memset是按照字节赋值,每个字节0x3f)
-
t == -1 || dist[t] > dist[j]使得t不必选第1个标记,实际上t = 1也是可以的,只需把循环条件从j = 2开始就可以
-
min(dist[j], dist[t] + g[t][j])不要错写成min(dist[j], g[1][t] + g[t][j])
-
对于重边的条件,不能使用编译器赋予的初值0,而应该赋予一个比边长最大值更大的值,例如memset(g, 0x3f, sizeof g),然后用g[a][b] = min(g[a][b], c)记录最小的重边即可
-
时间复杂度为O(n2+m)
b.堆优化dijkstra算法
模板:
typedef pair<int, int> PII;
int n; // 点的数量
int h[N], w[N], e[N], ne[N], idx; // 邻接表存储所有边
int dist[N]; // 存储所有点到1号点的距离
bool st[N]; // 存储每个点的最短距离是否已确定
// 求1号点到n号点的最短距离,如果不存在,则返回-1
int dijkstra()
{
memset(dist, 0x7f, sizeof dist);
dist[1] = 0;
priority_queue<PII, vector<PII>, greater<PII>> heap; // 小根堆
heap.push({0, 1}); // first存储距离(顶点1到顶点second的距离),second存储尾顶点编号
while (heap.size())
{
auto t = heap.top();
heap.pop();
int ver = t.second, distance = t.first;
if (st[ver]) continue;
st[ver] = true;
for (int i = h[ver]; i != -1; i = ne[i])
{
int j = e[i];
if (dist[j] > distance + w[i])
{
dist[j] = distance + w[i];
heap.push({dist[j], j});
}
}
}
if (dist[n] == 0x7f7f7f7f) return -1;
return dist[n];
}
说明:
- 边长最大值为104104,最多有1.5×1051.5×105条边,因此距离最大值为1.5×1091.5×109,因此0x3f3f3f3f不可代表最大值,可用0x7f7f7f7f代替
- 改用邻接表数据结构
- 使用小根堆优化查找最小距离的过程
- 小根堆可能存在冗余数据
- 算法类似BFS,因为在修改其它顶点最短距离的过程中,堆优化版本并没有遍历所有的顶点,而是遍历所有与当前选取的最小顶点有关的边
- 时间复杂度为O(mlogn)
Bellman-Ford
朴素Bellman-Ford算法
模板:
int n, m, k; // n表示点数,m表示边数,k是路径的最大边数
int dist[N], backup[N]; // dist[x]存储1到x的最短路距离
// 三元组
struct Edge // 边,a表示出点,b表示入点,w表示边的权重
{
int a, b, w;
}edges[M];
// 求1到n的最短路距离,如果无法从1走到n,则返回-1。
int bellman_ford()
{
memset(dist, 0x7f, sizeof dist);
dist[1] = 0;
// 如果第n次迭代仍然会松弛三角不等式(存在更新),就说明存在一条长度是n+1的最短路径,由抽屉原理,路径中至少存在两个相同的点,说明图中存在负权回路。
for (int i = 0; i < k; i ++ ) // 如果没有k,则用n代替k
{
memcpy(backup, dist, sizeof dist); // 备份,防止读后写
for (int j = 0; j < m; j ++ )
{
int a = edges[j].a, b = edges[j].b, w = edges[j].w;
dist[b] = min(dist[b], dist[a] + w)
}
}
if (dist[n] > 0x7f7f7f7f / 2) return -1;
return dist[n];
}
说明:
- 除了可以用邻接矩阵和邻接表外,还可用三元组存储图
- 允许存在负权边,而Dijkstra算法不允许
- 外循环次数决定最小路径的最大边数
- 若第n次迭代有修改,根据容斥原理知道,一定存在负权环(整个环的权重和为负数)
- 实际应用:换乘不超过kk次的最短路径(限制路径的边数)
- backup用于保存上次迭代的结果,避免“写后读”。Dijkstra算法不存在这种情况
- 由于存在负权回路(注意不是负权边),因此负权回路有可能把自定义的无穷大0x7f7f7f7f变小,由于最多修改10000×10000=10810000×10000=108,而0x7f7f7f7f>2×108>2×108,故0x7f7f7f7f / 2依旧是“无穷大”,故可用dist[n] > 0x7f7f7f7f / 2判断是否是无穷大
- 时间复杂度为O(mn)
队列优化Bellman-Ford算法——SPFA算法
模板:
int n; // 总点数
int h[N], w[N], e[N], ne[N], idx; // 邻接表存储所有边
int dist[N]; // 存储每个点到1号点的最短距离
bool st[N]; // 存储每个点是否在队列中
// 求1号点到n号点的最短路距离,如果从1号点无法走到n号点则返回-1
int spfa()
{
memset(dist, 0x7f, sizeof dist);
dist[1] = 0;
queue<int> q;
q.push(1);
st[1] = true;
while (q.size())
{
auto t = q.front();
q.pop();
st[t] = false; // 已出队,因此队列不再包含顶点t,需要重置为false
for (int i = h[t]; i != -1; i = ne[i])
{
int j = e[i];
if (dist[j] > dist[t] + w[i])
{
dist[j] = dist[t] + w[i];
if (!st[j]) // 如果队列中已存在j,则不需要将j重复插入
{
q.push(j);
st[j] = true;
}
}
}
}
if (dist[n] == 0x7f7f7f7f) return -1; // 如果题目保证不存在负权回路(不是指负权边),则可这么写
return dist[n];
}
说明:
-
用队列优化更新最短距离的过程,核心思想是
- dist[u]发生改变,dist[u] + w才有可能满足< dist[u]\
- 用队列保存最短距离发生改变的顶点(其它数据结构也可以,不一定是队列)
- 用st记录在队列中的顶点,避免重复更新
- 由于每次只更新与出队顶点相关的边,因此不会出现“写后读”现象,故改进的bellman-ford算法不需要额外的数组保存上次迭代的结果
-
SPFA算法有点像堆优化的Dijkstra算法,但后者依赖优先队列,而前者不需要
-
大多数情况下,Dijkstra算法能解决的问题,SPFA都比它更好,而且适用负权边,因此如果没有限制路径最大边数的情况下,优先考虑SPFA算法,如果过不了就考虑堆优化的Dijkstra算法
-
平均时间复杂度为O(m),最坏时间复杂度为O(mn)
-
若要判断负环,则需要额外维护一个数组cnt,用于记录各个最短路径的边数,当边数≥顶点数n时,则一定存在负环
Floyd算法
模板:
const int INF = 1E9;
// 初始化:
for (int i = 1; i <= n; i ++ )
for (int j = 1; j <= n; j ++ )
if (i == j) d[i][j] = 0;
else d[i][j] = INF;
// 算法结束后,d[a][b]表示a到b的最短距离
void floyd()
{
for (int k = 1; k <= n; k ++ )
for (int i = 1; i <= n; i ++ )
for (int j = 1; j <= n; j ++ )
d[i][j] = min(d[i][j], d[i][k] + d[k][j]);
}
//说明:
//最短距离需要把d[i][i] = 0;
//时间复杂度为O(n^3)
最小生成树:
Prim算法
模板:
cosnt int INF = 0x3f3f3f3f;
int n; // n表示点数
int g[N][N]; // 邻接矩阵,存储所有边
int dist[N]; // 存储其他点到当前最小生成树的距离(集合到点u的距离)
bool st[N]; // 存储每个点是否已经在生成树中
// 如果图不连通,则返回INF(值是0x3f3f3f3f), 否则返回最小生成树的树边权重之和
int prim()
{
memset(dist, 0x3f, sizeof dist);
int res = 0;
for (int i = 0; i < n; i ++ )
{
int t = -1;
for (int j = 1; j <= n; j ++ )
if (!st[j] && (t == -1 || dist[t] > dist[j]))
t = j;
if (i && dist[t] == INF) return INF; // 非首次遍历时,出现集合到其它点都是无穷大的情况,则图为非连通图
if (i) res += dist[t]; // 第1次迭代得到的dist为无穷大,没意义
st[t] = true;
for (int j = 1; j <= n; j ++ )
if(!st[j]) dist[j] = min(dist[j], g[t][j]); // 可不加if,集合内点的dist应失去意义(受自环影响)
}
return res;
}
说明:
1.注意最小生成树解决的是无向图问题,因此存储边时要添加两条有向边
2.允许存在负权边、自环、重边
a. 对于自环,需要先保存最短路径长度,再更新集合到其它点的距离,避免负权自环更新自己,出现写后读问题
b. 对于重边,需要初始化各个点的距离为INF,然后用min读入边
3.应用场景:多城市发电站的选址问题
4.可类似Dijkstra算法,用堆优化Prim算法,时间复杂度为O(mlogn)O(mlogn),但由于这个算法只适用稀疏图(因为如果是稠密图的话,性能还不如朴素的Prim算法),对于稀疏图来说,nn≈mm,此时性能和kruskal算法接近O(mlogm)O(mlogm),而kruskal算法代码更简洁,因此一般不用堆优化的Prim算法
5.Prim算法和Dijkstra算法非常相似
a. Prim算法更新其他点到集合的距离
b. Dijkstra算法更新其它点到起点的距离
6.采用邻接矩阵保存图,适用稠密图,时间复杂度为O(n2+m)O(n2+m)
Kruskal算法
模板:
int n, m; // n是点数,m是边数
int p[N]; // 并查集的父节点数组
// 三元组
struct Edge // 存储边
{
int a, b, w;
// 重载<,用于sort排序
bool operator< (const Edge &W)const
{
return w < W.w;
}
}edges[M];
int find(int x) // 并查集核心操作
{
if (p[x] != x) p[x] = find(p[x]);
return p[x];
}
int kruskal()
{
sort(edges, edges + m); // 快排,+m是地址运算,得到数组末尾
for (int i = 1; i <= n; i ++ ) p[i] = i; // 初始化并查集
int res = 0, cnt = 0; // cnt统计边数
for (int i = 0; i < m; i ++ )
{
int a = edges[i].a, b = edges[i].b, w = edges[i].w;
a = find(a), b = find(b);
if (a != b) // 如果两个连通块不连通,则将这两个连通块合并
{
p[a] = b;
res += w;
cnt ++ ;
}
}
if (cnt < n - 1) return INF; // 边数小于n-1,不连通
return res;
}
说明:
- 用于求解稀疏图的最小生成树
- 采用三元组存储图时,没必要保存两条有向边
- 实际上是并查集的简单应用,可参考题目
- 由于是稀疏图,nn≈mm,因此没必要在遍历边时提前判断集合a中是否有n个顶点
- 时间复杂度O(mlogm)O(mlogm),主要来自排序步骤由于需要对结构体数组排序,因此需要重载<
染色法
用途
判断二分图
模板:
int n; // n表示点数
int h[N], e[M], ne[M], idx; // 邻接表存储图
int color[N]; // 表示每个点的颜色,-1表示未染色,0表示白色,1表示黑色
// 参数:u表示当前节点,c表示当前点的颜色
bool dfs(int u, int c)
{
color[u] = c; // 染色
for (int i = h[u]; i != -1; i = ne[i])
{
int j = e[i];
if (!color[j])
{
if (!dfs(j, 3 - c)) return false; // 用3-c实现交替染色
}
else if (color[j] == c) return false;
}
return true;
}
bool check()
{
bool flag = true;
for (int i = 1; i <= n; i ++ )
if (!color[i])
if (!dfs(i, 1)) // 这里不需要3-c,因为这里进入的都是未染色的起点,换句话说是森林另一棵树的根
{
flag = false;
break;
}
return flag;
}
说明:
- 用邻接表存储图,注意无向图的边数为2m
- 核心思想:一个图是二分图,当且仅当图中不含奇数环(环的边数是奇数)
- 时间复杂度O(n+m)O(n+m)
匈牙利算法
用途
二分图的最大匹配
模板:
int n1, n2; // n1表示第一个集合中的点数,n2表示第二个集合中的点数
int h[N], e[M], ne[M], idx; // 邻接表存储所有边,匈牙利算法中只会用到从第一个集合指向第二个集合的边,所以这里只用存一个方向的边
int match[N]; // 存储第二个集合中的每个点当前匹配的第一个集合中的点是哪个
bool st[N]; // 表示第二个集合中的每个点是否已经被遍历过
bool find(int x)
{
for (int i = h[x]; i != -1; i = ne[i])
{
int j = e[i];
if (!st[j])
{
st[j] = true; // 标记已遍历
if (!match[j] || find(match[j])) // j未被匹配,或j已经匹配但其配对对象可选其它的匹配
{
match[j] = x;
return true;
}
}
}
return false;
}
// 求最大匹配数,依次枚举第一个集合中的每个点能否匹配第二个集合中的点
int res = 0;
for (int i = 1; i <= n1; i ++ )
{
memset(st, false, sizeof st);
if (find(i)) res ++ ;
}
说明:
- 用邻接表存储图,但不必存放双向边,只需存储单向边,因此最大边数为M,而不必用2M
- 核心思想:
- 假设a和b是左边顶点,c和d是右边顶点,a和b都能匹配c,但a还可以匹配d
- 当a匹配c后,b没有右边顶点可匹配
- a存在另一个可匹配顶点d,因此把a改成匹配d,这时b再匹配c
- 最坏时间复杂度O(nm)O(nm),但实际上会远远小于该复杂度

浙公网安备 33010602011771号