秒懂算法 | 搜索基础

作者：TiAmo

2023-03-07
江苏
本文字数：6890 字
阅读完需：约 23 分钟

01、搜索简介

搜索，就是查找解空间，它是“暴力法”算法思想的具体实现。

暴力法（Brute force，又译为蛮力法）：把所有可能的情况都罗列出来，然后逐一检查，从中找到答案。这种方法简单、直接，不玩花样，利用了计算机强大的计算能力。

搜索是“通用”的方法。一个问题，如果比较难，那么先尝试一下搜索，或许能启发出更好的算法。竞赛的时候，遇到不会的难题，如果有时间，就用搜索提交一下，说不定判题数据很弱，就通过了。

搜索的思路很简单，但是操作起来也并不容易。一般有以下操作：

（1）找到所有可能的数据，并且用数据结构表示和存储。常用的搜索算法是 BFS 和 DFS。

（2）优化。尽量多地排除不符合条件的数据，以减少搜索的空间。

（3）用某个算法快速检索这些数据。

02、搜索算法的基本思路

搜索的基本算法是：深度优先搜索（DFS, Depth-First Search）、宽度优先搜索（BFS, Breadth-First Search，或称为广度优先搜索）。

这两个算法的思想，用老鼠走迷宫的例子来说明，又形象又透彻。

迷宫内部的路错综复杂，老鼠从入口进去后，怎么才能找到出口？有两种不同的方法：

（1）一只老鼠走迷宫。它在每个路口，都选择先走右边（当然，选择先走左边也可以），能走多远就走多远；直到碰壁无法再继续往前走，然后往回退一步，这一次走左边，然后继续往下走。用这个办法，能走遍所有的路，而且不会重复（回退不算重复走）。这个思路，就是 DFS。

（2）一群老鼠走迷宫。假设老鼠是无限多的，这群老鼠进去后，在每个路口，都派出部分老鼠探索所有没走过的路。走某条路的老鼠，如果碰壁无法前行，就停下；如果到达的路口已经有别的老鼠探索过了，也停下。很显然，所有的道路都会走到，而且不会重复。这个思路，就是 BFS。BFS 看起来像“并行计算”，不过，由于程序是单机顺序运行的，所以，可以把 BFS 看成是并行计算的模拟。

简洁地说：BFS 是“逐层扩散”，DFS 是“一路到底、逐层回退”。

下面用一棵二叉树为例子，演示 BFS 和 DFS 的访问顺序。

▍图 1 一棵二叉树

（1）BFS 的访问顺序是：{E B G A D F I C H}，即“第 1 层 E–第 2 层 BG–第 3 层 ADFI–第 4 层 CH”。

（2）DFS 的访问顺序，设先访问左节点，后访问右节点，那么访问顺序是：{E B A D C G F I H}。需要注意的是，访问顺序不是输出顺序。例如上面的二叉树，它的中序遍历、先序遍历、后序遍历都不同，但是对节点的访问顺序是一样的（实际上就是先序遍历）。具体操作，见下一节的代码。

03、BFS 的性质和代码实现

BFS 和 DFS 的实现：“BFS=队列”，“DFS=递归”。

为什么“BFS=队列”呢？以老鼠走迷宫为例，从起点 s 开始，一层一层地扩散出去。处理完离 s 近的第 i 层之后，再处理第 i+1 层。这一操作用队列最方便，处理第 i 层的节点 a 时，把 a 的第 i+1 层的邻居，放到队列尾部即可。

队列内的节点有 2 个特征：

（1）处理完第 i 层后，才会处理第 i+1 层；

（2）队列中最多有 2 层节点，其中第 i 层节点都在第 i+1 层前面。

下面给出 BFS 遍历图 1 二叉树的代码。分别给出了静态版和指针版二叉树的代码，我们一般用静态版二叉树，不易出错。两个代码都使用 STL 的 queue 队列。

两个代码的输出都是：E B G A D F I C H。

BFS（静态版二叉树）

#include <bits/stdc++.h>using namespace std;const int maxn = 100005;struct Node{                  //静态二叉树    char value;    int lchild, rchild;}node[maxn]; int index = 0; //记录节点int newNode(char val){  node[index].value = val;  node[index].lchild = -1; //-1表示空  node[index].rchild = -1;  return index ++;}void insert(int &father, int child, int l_r){ //插入孩子  if(l_r == 0) //左孩子    node[father].lchild = child;  else                      //右孩子    node[father].rchild = child;}int buildtree(){ //建一棵二叉树    int A = newNode('A');int B = newNode('B');int C = newNode('C');    int D = newNode('D');int E = newNode('E');int F = newNode('F');    int G = newNode('G');int H = newNode('H');int I = newNode('I');    insert(E,B,0); insert(E,G,1); //E的左孩子是B，右孩子是G    insert(B,A,0); insert(B,D,1);    insert(G,F,0); insert(G,I,1);    insert(D,C,0); insert(I,H,0);    int root = E;    return root;}int main(){    int root = buildtree();    queue <int> q;    q.push(root); //从根节点开始    while(q.size()){        int tmp = q.front();        cout << node[tmp].value << " "; //打印队头        q.pop(); //去掉队头        if(node[tmp].lchild != -1) q.push(node[tmp].lchild); //左孩子入队        if(node[tmp].rchild != -1) q.push(node[tmp].rchild); //右孩子入队    }    return 0;}

复制代码

作为对照，下面给出指针版二叉树代码。

BFS（指针版二叉树）

#include <bits/stdc++.h>using namespace std; struct node{ //指针二叉树    char value;    node *l, *r;    node(char value = '#', node *l = NULL, node *r = NULL):value(value), l(l), r(r){}};void remove_tree(node *root){ //释放空间    if(root == NULL) return;    remove_tree(root->l);    remove_tree(root->r);    delete root;}int main(){    node *A,*B,*C,*D,*E,*F,*G,*H,*I; //以下建一棵二叉树    A = new node('A'); B = new node('B'); C = new node('C');    D = new node('D'); E = new node('E'); F = new node('F');    G = new node('G'); H = new node('H'); I = new node('I');    E->l = B; E->r = G; B->l = A; B->r = D;    G->l = F; G->r = I; D->l = C; I->l = H; //以上建了一棵二叉树     queue <node> q;    q.push(*E);    while(q.size()){        node *tmp;        tmp = &(q.front());        cout << tmp->value << " "; //打印队头        q.pop(); //去掉队头        if(tmp->l) q.push(*(tmp->l)); //左孩子入队        if(tmp->r) q.push(*(tmp->r)); //右孩子入队    }    remove_tree(E);    return 0;}

复制代码

BFS 是逐层扩散的，非常符合在图上计算最短路径，先扩散到的节点，离根节点更近。很多最短路径算法，都是在 BFS 上发展出来的。

04、DFS 的常见操作和代码实现

1. DFS 的常见操作

DFS 的原理，就是递归的过程。

DFS 的代码比 BFS 更简短一些。下面给出两个代码，分别基于指针版和静态版二叉树。它们输出了图 1 二叉树的各种 DFS 操作，有时间戳、DFS 序、树深度、子树节点数，另外还给出了二叉树的中序输出、先序输出、后序输出。

DFS 访问节点，经常用到以下操作：

（1）节点第一次被访问的时间戳。用 dfn[i]表示节点 i 第一次被访问的时间戳，函数 dfn_order()打印出了时间戳：

dfn[E]=1; dfn[B]=2; dfn[A]=3; dfn[D]=4; dfn[C]=5;

dfn[G]=6; dfn[F]=7; dfn[I]=8; dfn[H]=9。

时间戳就是先序输出。

（2）DFS 序。在递归时，每个节点会来回访问 2 次，即第 1 次访问和第 2 次回溯。函数 visit_order()打印出了 DFS 序：

{E B A A D C C D B G F F I H H I G E}

这个序列有一个重要特征：每个节点出现 2 次，被这 2 次包围起来的，是以它为父节点的一棵子树。例如序列中的{B A A D C C D B}，就是 B 为父节点的一棵子树，又例如{I H H I}，是以 I 为父节点的一棵子树。这个特征是递归操作产生的。

（3）树的深度。从根节点往子树 DFS，每个节点第一次被访问时，深度加 1，从这个节点回溯时，深度减 1。用 deep[i]表示节点 i 的深度，函数 deep_node()打印出了深度：

deep[E]=1; deep[B]=2; deep[A]=3; deep[D]=3; deep[C]=4;

deep[G]=2; deep[F]=3; deep[I]=3; deep[H]=4。

（4）子树节点总数。用 num[i]表示以 i 为父亲的子树上的节点总数，例如，以 B 为父节点的子树，共有 4 个节点{A B C D}。只需要简单地 DFS 一次就能完成，每个节点的数量等于它的 2 个子树的数量相加，再加 1，即加它自己。函数 num_node()做了计算并打印出了以每个节点为父亲的子树上的节点数量。

另外还有树的重心：在一棵中，找到一个节点，把树变为以该点为根的有根树，并且最大子树的结点数最小。本文没有给出代码。

我们一般用静态版二叉树写代码。作为对照，后面也给出指针版二叉树的代码。

DFS（静态版二叉树）

#include <bits/stdc++.h>using namespace std;const int maxn = 100005; struct Node{    char value;    int lchild, rchild;}node[maxn]; int index = 0; //记录节点int newNode(char val){ //新建节点  node[index].value = val;  node[index].lchild = -1; //-1表示空  node[index].rchild = -1;  return index ++;}void insert(int &father, int child, int l_r){ //插入孩子  if(l_r == 0) //左孩子    node[father].lchild = child;  else                      //右孩子    node[father].rchild = child;}int dfn[maxn] = {0}; //dfn[i]是节点i的时间戳int dfn_timer = 0;void dfn_order (int father){    if(father != -1){        dfn[father] = ++dfn_timer;        printf("dfn[%c]=%d; ", node[father].value, dfn[father]);                                    //打印访问节点的时间戳        dfn_order (node[father].lchild);        dfn_order (node[father].rchild);    }}int visit_timer = 0;void visit_order (int father){ //打印DFS序    if(father != -1){        printf("visit[%c]=%d; ", node[father].value, ++visit_timer);                                      //打印DFS序：第1次访问节点        visit_order (node[father].lchild);        visit_order (node[father].rchild);        printf("visit[%c]=%d; ", node[father].value, ++visit_timer);                                      //打印DFS序：第2次回溯    }}int deep[maxn] = {0}; //deep[i]是节点i的深度int deep_timer = 0;void deep_node (int father){    if(father != -1){        deep[father] = ++deep_timer;        printf("deep[%c]=%d; ",node[father].value,deep[father]);                                      //打印树的深度，第一次访问时，深度+1        deep_node (node[father].lchild);        deep_node (node[father].rchild);        deep_timer--; //回溯时，深度-1    }}int num[maxn] = {0}; //num[i]是以i为父亲的子树上的节点总数int num_node (int father){    if(father == -1) return 0;    else{        num[father] = num_node (node[father].lchild) +                      num_node (node[father].rchild) + 1;        printf("num[%c]=%d; ", node[father].value, num[father]); //打印数量        return num[father];    }}void preorder (int father){ //求先序序列    if(father != -1){        cout << node[father].value <<" "; //先序输出        preorder (node[father].lchild);        preorder (node[father].rchild);    }}void inorder (int father){ //求中序序列    if(father != -1){        inorder (node[father].lchild);;        cout << node[father].value <<" "; //中序输出        inorder (node[father].rchild);    }}void postorder (int father){ //求后序序列    if(father != -1){        postorder (node[father].lchild);;        postorder (node[father].rchild);        cout << node[father].value <<" "; //后序输出    }}int buildtree(){ //建一棵树    int A = newNode('A');int B = newNode('B');int C = newNode('C');    int D = newNode('D');int E = newNode('E');int F = newNode('F');    int G = newNode('G');int H = newNode('H');int I = newNode('I');    insert(E,B,0); insert(E,G,1); //E的左孩子是B，右孩子是G    insert(B,A,0); insert(B,D,1);    insert(G,F,0); insert(G,I,1);    insert(D,C,0); insert(I,H,0);    int root = E;    return root;}int main(){    int root = buildtree();    cout <<"dfn order: "; dfn_order(root); cout <<endl; //打印时间戳    cout <<"visit order: "; visit_order(root); cout <<endl; //打印DFS序    cout <<"deep order: "; deep_node(root); cout <<endl; //打印节点深度    cout <<"num of tree: "; num_node(root); cout <<endl; //打印子树上的节点数    cout <<"in order: "; inorder(root); cout << endl; //打印中序序列    cout <<"pre order: "; preorder(root); cout << endl; //打印先序序列    cout <<"post order: "; postorder(root); cout << endl; //打印后序序列    return 0;}/*输出是：dfn order: dfn[E]=1; dfn[B]=2; dfn[A]=3; dfn[D]=4; dfn[C]=5; dfn[G]=6; dfn[F]=7; dfn[I]=8; dfn[H]=9;visit order: visit[E]=1; visit[B]=2; visit[A]=3; visit[A]=4; visit[D]=5; visit[C]=6; visit[C]=7; visit[D]=8; visit[B]=9; visit[G]=10; visit[F]=11; visit[F]=12; visit[I]=13; visit[H]=14; visit[H]=15; visit[I]=16; visit[G]=17; visit[E]=18;deep order: deep[E]=1; deep[B]=2; deep[A]=3; deep[D]=3; deep[C]=4; deep[G]=2; deep[F]=3; deep[I]=3; deep[H]=4;num of tree: num[A]=1; num[C]=1; num[D]=2; num[B]=4; num[F]=1; num[H]=1; num[I]=2; num[G]=4; num[E]=9;in order: A B C D E F G H Ipre order: E B A D C G F I Hpost order: A C D B F H I G E*/

复制代码

DFS（指针版二叉树）

#include <bits/stdc++.h>using namespace std; struct node{    char value;    node *l, *r;    node(char value = '#', node *l = NULL, node *r = NULL):value(value), l(l), r(r){}};void preorder (node *root){ //求先序序列    if(root != NULL){        cout << root->value <<" "; //先序输出        preorder (root ->l);        preorder (root ->r);    }}void inorder (node *root){ //求中序序列    if(root != NULL){        inorder (root ->l);        cout << root->value <<" "; //中序输出        inorder (root ->r);    }}void postorder (node *root){ //求后序序列    if(root != NULL){        postorder (root ->l);        postorder (root ->r);        cout << root->value <<" "; //后序输出    }}void remove_tree(node *root){ //释放空间    if(root == NULL) return;    remove_tree(root->l);    remove_tree(root->r);    delete root;}int main(){    node *A, *B,*C,*D,*E,*F,*G,*H,*I;    A = new node('A'); B = new node('B'); C = new node('C');    D = new node('D'); E = new node('E'); F = new node('F');    G = new node('G'); H = new node('H'); I = new node('I');    E->l = B; E->r = G; B->l = A; B->r = D;    G->l = F; G->r = I; D->l = C; I->l = H;     cout <<"in order: "; inorder(E); cout << endl; //打印中序序列    cout <<"pre order: "; preorder(E); cout << endl; //打印先序序列    cout <<"post order: "; postorder(E); cout << endl; //打印后序序列    remove_tree(E);    return 0;}

复制代码

DFS 是一直深入的，适合处理节点间的先后关系、连通性等，在图论中应用很广泛。

2. DFS 代码框架

DFS 的代码看起来比较简单，但是逻辑上难以理解，不容易编码。

下面给出 DFS 的框架。

ans; //答案，用全局变量表示void dfs(层数，其他参数){    if (出局判断){ //到达最底层，或者满足条件退出        更新答案; //答案一般用全局变量表示        return; //返回到上一层    }    (剪枝) //在进一步DFS之前剪枝    for (枚举下一层可能的情况) //对每一个情况继续DFS        if (used[i] == 0) { //如果状态i没有用过，就可以进入下一层            used[i] = 1; //标记状态i,表示已经用过，在更底层不能再使用            dfs(层数+1，其他参数); //下一层            used[i] = 0; //恢复状态，回溯时，不影响上一层对这个状态的使用            }    return; //返回到上一层}

复制代码

05、BFS 和 DFS 的复杂度

以图为例，图中的所有 n 个点和所有 m 条边都应该至少访问一次，所以复杂度至少是 O(n+m)的。很多情况下，点和边会计算多次。例如计算图上两个点之间的最短路径，一条路径包含很多点和边，一个点或一个边可能属于不同的路径，需要计算多次，复杂度就会超过 O(n+m)。

在 BFS 和 DFS 基础上，发展出了剪枝、记忆化（DFS）、双向广搜（BFS）、迭代加深搜索（DFS）、A*（BFS）等技术，大大增强了搜索的能力。

DFS 的代码比 BFS 更简单，如果一个问题用 BFS 和 DFS 都行，一般用 DFS。

搜索的题目，关键往往在于去重。例如 BFS 的队列，把状态放进队列时，需要判断这个状态是否已经在队列中处理过，如果已经处理过，就不用放进队列，这就是去重。去重能大大优化复杂度。去重用 hash 很方便，缺点是很浪费空间。

发布于: 2023-03-07阅读数: 30

原文链接:【http://xie.infoq.cn/article/7c3e5265acc98a50434521f12】。文章转载请联系作者。

TiAmo

关注

有能力爱自己，有余力爱别人！ 2022-06-16 加入

CSDN全栈领域优质创作者，万粉博主；阿里云专家博主、星级博主、技术博主、阿里云问答官，阿里云MVP；华为云享专家；华为Iot专家；亚马逊人工智能自动驾驶（大众组）吉尼斯世界纪录获得者

发布

暂无评论

创作场景

秒懂算法 | 搜索基础

01、搜索简介

02、搜索算法的基本思路

03、BFS 的性质和代码实现

04、DFS 的常见操作和代码实现

1. DFS 的常见操作

2. DFS 代码框架

05、BFS 和 DFS 的复杂度

TiAmo

评论