深度优先和广度优先搜索

一、二叉树深度优先（DFS）和广度优先（BFS）搜索算法

树的相关概念参见红黑树详解

（1）深度优先搜索算法（Depth First Search），是搜索算法的一种。是沿着树的深度遍历树的节点，尽可能深的搜索树的分支。当节点v的所有边都己被探寻过，搜索将回溯到发现节点v的那条边的起始节点。这一过程一直进行到已发现从源节点可达的所有节点为止。如果还存在未被发现的节点，则选择其中一个作为源节点并重复以上过程，整个进程反复进行直到所有节点都被访问为止。

如下图所示的二叉树：

A 是第一个访问的，然后顺序是 B、D，然后是 E。接着再是 C、F、G。那么，怎么样才能来保证这个访问的顺序呢？分析一下，在遍历了根结点后，就开始遍历左子树，最后才是右子树。因此可以借助堆栈的数据结构，由于堆栈是后进先出的顺序，由此可以先将右子树压栈，然后再对左子树压栈，这样一来，左子树结点就存在了栈顶上，因此某结点的左子树能在它的右子树遍历之前被遍历。

深度优先遍历代码片段：

//深度优先遍历:非递归,使用栈模拟
void depthFirstSearch(Tree root){
    stack<Node *> nodeStack;  //使用C++的STL标准模板库
    nodeStack.push(root);
    Node *node;
    while(!nodeStack.empty()){
        node = nodeStack.top();
        printf(format, node->data);  //遍历根结点
        nodeStack.pop();
        if(node->rchild){
            nodeStack.push(node->rchild);  //先将右子树压栈
        }
        if(node->lchild){
            nodeStack.push(node->lchild);  //再将左子树压栈
        }
    }
}

//深度优先遍历:递归,中序遍历
void MidOrder(TreeNode node)         
{            
    if (node != null)            
    {                
        MidOrder(node->lchild);                
        printf(format, node->data);  //遍历根结点             
        MidOrder(node->lchild);            
    }            
    else            
    {                
        //done            
    }        
}

（2）广度优先搜索算法（Breadth First Search），又叫宽度优先搜索，或横向优先搜索。是从根节点开始，沿着树的宽度遍历树的节点。如果所有节点均被访问，则算法中止。

如下图所示的二叉树：

A 是第一个访问的，然后顺序是 B、C，然后再是 D、E、F、G。那么，怎样才能来保证这个访问的顺序呢？借助队列数据结构，由于队列是先进先出的顺序，因此可以先将左子树入队，然后再将右子树入队。这样一来，左子树结点就存在队头，可以先被访问到。

广度优先遍历代码片段：

//广度优先遍历:使用队列模拟
void breadthFirstSearch(Tree root){
    queue<Node *> nodeQueue;  //使用C++的STL标准模板库
    nodeQueue.push(root);
    Node *node;
    while(!nodeQueue.empty()){
        node = nodeQueue.front();
        nodeQueue.pop();
        printf(format, node->data);
        if(node->lchild){
            nodeQueue.push(node->lchild);  //先将左子树入队
        }
        if(node->rchild){
            nodeQueue.push(node->rchild);  //再将右子树入队
        }
    }
}

二、图的深度优先（DFS）和广度优先（BFS）搜索算法

在介绍图的搜索之前，有必要先了解计算机中图的存储方式。图的存储表示方法很多，这里介绍两种最常用的方法。至于具体选择哪一种表示法，主要取决于具体的应用和欲施加的操作。为了适合用C语言描述，以下假定顶点序号从0开始，即图G的顶点集的一般形式是V(G)={v₀，v_i，…，V_n-1}。
（1）图的邻接矩阵表示法
1．图的邻接矩阵表示法　

在图的邻接矩阵表示法中：　

　　① 用邻接矩阵表示顶点间的相邻关系　

　　② 用一个顺序表来存储顶点信息

2．图的邻接矩阵(Adacency Matrix) 　

设G=(V，E)是具有n个顶点的图，则G的邻接矩阵是具有如下性质的n阶方阵：

【例】下图中无向图G₅和有向图G₆的邻接矩阵分别为A_l和A₂。

3．网络的邻接矩阵 　

若G是网络，则邻接矩阵可定义为：

其中：

　　w_ij表示边上的权值；

　　∞表示一个计算机允许的、大于所有边上权值的数。

【例】下面带权图的两种邻接矩阵分别为A₃和A₄。

4．图的邻接矩阵存储结构形式说明

#define MaxVertexNum l00 //最大顶点数，应由用户定义
  typedef char VertexType； //顶点类型应由用户定义
  typedef int EdgeType； //边上的权值类型应由用户定义
  typedef struct{
      VextexType vexs[MaxVertexNum] //顶点表
      EdeType edges[MaxVertexNum][MaxVertexNum];
                    //邻接矩阵，可看作边表
      int n，e； //图中当前的顶点数和边数
   }MGragh；

注意：　

　　① 在简单应用中，可直接用二维数组作为图的邻接矩阵（顶点表及顶点数等均可省略）。　

　　② 当邻接矩阵中的元素仅表示相应的边是否存在时，EdgeTyPe可定义为值为0和1的枚举类型。　

　　③ 无向图的邻接矩阵是对称矩阵，对规模特大的邻接矩阵可压缩存储。　

　　④ 邻接矩阵表示法的空间复杂度S(n)=0(n²)。

5．建立无向网络的算法。

void CreateMGraph(MGraph *G)
    {//建立无向网的邻接矩阵表示
      int i，j，k，w；
      scanf("％d％d"，&G->n，&G->e)； //输入顶点数和边数
      for(i=0;i<G->n；i++) //读人顶点信息，建立顶点表
        G->vexs[i]=getchar()；
      for(i=0；i<G->n；i++)
        for(j=0；j<G->n；j++) 
          G->edges[i][j]=0； //邻接矩阵初始化
      for(k=0；k<G->e；k++){//读入e条边，建立邻接矩阵
        scanf("％d％d％d"，&i，&j，&w)；//输入边(vi,vj)上的权w
        G->edges[i][j]=w；
        G->edges[j][i]=w；
       }
    }//CreateMGraph

该算法的执行时间是0(n+n²+e)。由于e<n²，算法的时间复杂度是0(n²)。

（2）图的邻接表表示法
　　图的邻接表表示法类似于树的孩子链表表示法。对于图G中的每个顶点v_i，该方法把所有邻接于v_i的顶点v_j链成一个带头结点的单链表，这个单链表就称为顶点v_i的邻接表(Adjacency
List)。
1．邻接表的结点结构
（1）表结点结构

邻接表中每个表结点均有两个域:
　　① 邻接点域adjvex：存放与vi相邻接的顶点v_j的序号j。
　　② 链域next：将邻接表的所有表结点链在一起。
注意：若要表示边上的信息(如权值)，则在表结点中还应增加一个数据域。

（2）头结点结构

顶点v_i邻接表的头结点包含两个域：
　　① 顶点域vertex：存放顶点v_i的信息
　　② 指针域firstedge：v_i的邻接表的头指针。

注意：
　　 ① 为了便于随机访问任一顶点的邻接表，将所有头结点顺序存储在一个向量中就构成了图的邻接表表示。
　② 有时希望增加对图的顶点数及边数等属性的描述，可将邻接表和这些属性放在一起来描述图的存储结构。
2．无向图的邻接表
　　对于无向图，v_i的邻接表中每个表结点都对应于与v_i相关联的一条边。因此，将邻接表的表头向量称为顶点表。将无向图的邻接表称为边表。
【例】对于无向图G₅，其邻接表表示如下面所示，其中顶点v₀的边表上三个表结点中的顶点序号分别为1、2和3，它们分别表示关联于v₀的三条边(v₀，v₁)，(v₀，v₂)和(v₀，v₃)。

注意：n个顶点e条边的无向图的邻接表表示中有n个顶点表结点和2e个边表结点。
3．有向图的邻接表
　　对于有向图，v_i的邻接表中每个表结点都对应于以v_i为始点射出的一条边。因此，将有向图的邻接表称为出边表。
【例】有向图G₆的邻接表表示如下面(a)图所示，其中顶点v₁的邻接表上两个表结点中的顶点序号分别为0和4，它们分别表示从v₁射出的两条边(简称为v₁的出边)：<v₁，v₀>和<v₁，v₄>。

注意：n个顶点e条边的有向图，它的邻接表表示中有n个顶点表结点和e个边表结点。
4．有向图的逆邻接表
在有向图中，为图中每个顶点v_i建立一个入边表的方法称逆邻接表表示法。
入边表中的每个表结点均对应一条以v_i为终点(即射入v_i)的边。
【例】G₆的逆邻表如上面(b)图所示，其中v₀的人边表上两个表结点1和3分别表示射人v₀的两条边(简称为v₀的入边)：<v₁，v₀>和<v₃，v₀>。
注意：n个顶点e条边的有向图，它的接表表示中有n个顶点表结点和e个边表结点。

5．邻接表的形式说明及其建表算法
（1）邻接表的形式说明

typedef struct node{//边表结点
　　　　   int adjvex； //邻接点域
　　　　   struct node *next； //链域
　　　　　//若要表示边上的权，则应增加一个数据域
　　　}EdgeNode;
     typedef struct vnode{ //顶点表结点
　　　　   VertexType vertex； //顶点域
　　　　   EdgeNode *firstedge；//边表头指针
　　　 }VertexNode；
     typedef VertexNode AdjList[MaxVertexNum]；//AdjList是邻接表类型
      typedef struct{
　　　    AdjList adjlist；//邻接表
　　　    int n，e； // 图中当前顶点数和边数 
　　　}ALGraph； //对于简单的应用，无须定义此类型，可直接使用AdjList类型。

(2)建立无向图的邻接表算法

void CreateALGraPh(ALGrahp *G)
    {//建立无向图的邻接表表示
      int i，j，k；
      EdgeNode *s；
      scanf("％d％d"，&G->n，&G->e)； //读人顶点数和边数
      for(i=0；i<G->n；i++){//建立顶点表
        G->adjlist[i].vertex=getchar()； //读入顶点信息
        G->adjlist[i].firstedge=NULL；//边表置为空表
       }
      for(k=0；k<G->e；k++){//建立边表
         scanf("％d％d"，&i,&j)；// 读入边(vi，vj)的顶点对序号
         s=(EdgeNode *)malloc(sizeof(EdgeNode))； //生成边表结点
         s->adjvex=j; //邻接点序号为j
         s->next=G->adjlist[i].firstedge；
         G->adjlist[i].firstedge=s； //将新结点*s插入顶点vi的边表头部
         s=(EdgeNode *)malloc(sizeof(EdgeNode))；
         s->adjvex=i; //邻接点序号为i
         s->next=G->adjlist[j].firstedge；
         G->adjlistk[j].firstedge=s； //将新结点*s插入顶点vj的边表头部
        }//end for 
   }CreateALGraph

该算法的时间复杂度是O(n+e)。
注意：

　　①建立有向图的邻接表更简单，每当读人一个顶点对序号<i,j>时，仅需生成一个邻接序号为j的边表结点，将其插入到v_j的出边表头部即可。
　　② 建立网络的邻接表时，需在边表的每个结点中增加一个存储边上权的数据域。

（3）图的遍历

1、图的遍历
　　和树的遍历类似，图的遍历也是从某个顶点出发，沿着某条搜索路径对图中每个顶点各做一次且仅做一次访问。它是许多图的算法的基础。深度优先遍历和广度优先遍历是最为重要的两种遍历图的方法。它们对无向图和有向图均适用。

注意：
　　以下假定遍历过程中访问顶点的操作是简单地输出顶点。

2、布尔向量visited[0．．n-1]的设置
　　图中任一顶点都可能和其它顶点相邻接。在访问了某顶点之后，又可能顺着某条回路又回到了该顶点。为了避免重复访问同一个顶点，必须记住每个已访问的顶点。为此，可设一布尔向量visited[0．．n-1]，其初值为假，一旦访问了顶点Vi之后，便将visited[i]置为真。

深度优先遍历(Depth-First Traversal)

1．图的深度优先遍历的递归定义

假设给定图G的初态是所有顶点均未曾访问过。在G中任选一顶点v为初始出发点(源点)，则深度优先遍历可定义如下：首先访问出发点v，并将其标记为已访问过；然后依次从v出发搜索v的每个邻接点w。若w未曾访问过，则以w为新的出发点继续进行深度优先遍历，直至图中所有和源点v有路径相通的顶点(亦称为从源点可达的顶点)均已被访问为止。若此时图中仍有未访问的顶点，则另选一个尚未访问的顶点作为新的源点重复上述过程，直至图中所有顶点均已被访问为止。
　图的深度优先遍历类似于树的前序遍历。采用的搜索方法的特点是尽可能先对纵深方向进行搜索。这种搜索方法称为深度优先搜索(Depth-First Search)。相应地，用此方法遍历图就很自然地称之为图的深度优先遍历。

2、深度优先搜索的过程
　设x是当前被访问顶点，在对x做过访问标记后，选择一条从x出发的未检测过的边(x，y)。若发现顶点y已访问过，则重新选择另一条从x出发的未检测过的边，否则沿边(x，y)到达未曾访问过的y，对y访问并将其标记为已访问过；然后从y开始搜索，直到搜索完从y出发的所有路径，即访问完所有从y出发可达的顶点之后，才回溯到顶点x，并且再选择一条从x出发的未检测过的边。上述过程直至从x出发的所有边都已检测过为止。此时，若x不是源点，则回溯到在x之前被访问过的顶点；否则图中所有和源点有路径相通的顶点(即从源点可达的所有顶点)都已被访问过，若图G是连通图，则遍历过程结束，否则继续选择一个尚未被访问的顶点作为新源点，进行新的搜索过程。

3、深度优先遍历的递归算法

//（1）深度优先遍历算法
  typedef enum{FALSE，TRUE}Boolean；//FALSE为0，TRUE为1
  Boolean visited[MaxVertexNum]； //访问标志向量是全局量
  void DFSTraverse(ALGraph *G)
  { //深度优先遍历以邻接表表示的图G，而以邻接矩阵表示G时，算法完全与此相同
    int i；
    for(i=0;i<G->n;i++)
      visited[i]=FALSE； //标志向量初始化
    for(i=0;i<G->n；i++)
      if(!visited[i]) //vi未访问过
        DFS(G，i)； //以vi为源点开始DFS搜索
   }//DFSTraverse

//（2）邻接表表示的深度优先搜索算法
  void DFS(ALGraph *G，int i){ 
    //以vi为出发点对邻接表表示的图G进行深度优先搜索
    EdgeNode *p；
    printf("visit vertex：％c"，G->adjlist[i].vertex)；//访问顶点vi
    visited[i]=TRUE； //标记vi已访问
    p=G->adjlist[i].firstedge； //取vi边表的头指针
    while(p){//依次搜索vi的邻接点vj，这里j=p->adjvex
      if (!visited[p->adjvex])//若vi尚未被访问
        DFS(G，p->adjvex);//则以Vj为出发点向纵深搜索
      p=p->next； //找vi的下一邻接点
     }
   }//DFS

//（3）邻接矩阵表示的深度优先搜索算法
  void DFSM(MGraph *G，int i)
  { //以vi为出发点对邻接矩阵表示的图G进行DFS搜索，设邻接矩阵是0,l矩阵
    int j；
    printf("visit vertex：％c"，G->vexs[i])；//访问顶点vi
    visited[i]=TRUE；
    for(j=0；j<G->n；j++) //依次搜索vi的邻接点
      if(G->edges[i][j]==1&&!visited[j])
        DFSM(G，j)//(vi，vj)∈E，且vj未访问过，故vj为新出发点
   }//DFSM

4、算法分析
　　对于具有n个顶点和e条边的无向图或有向图，遍历算法DFSTraverse对图中每顶点至多调用一次DFS或DFSM。从DFSTraverse中调用DFS(或DFSM)及DFS(或DFSM)内部递归调用自己的总次数为n。
　　当访问某顶点v_i时，DFS(或DFSM)的时间主要耗费在从该顶点出发搜索它的所有邻接点上。用邻接矩阵表示图时，其搜索时间为O(n)；用邻接表表示图时，需搜索第i个边表上的所有结点。因此，对所有n个顶点访问，在邻接矩阵上共需检查n²个矩阵元素，在邻接表上需将边表中所有O(e)个结点检查一遍。
所以，DFSTraverse的时间复杂度为O(n²) （调用DFSM）或0(n+e)（调用DFS）。

5、深度优先遍历的非递归算法

// 图的深度优先遍历：非递归，邻接矩阵存储
void DFSTraverse_NonRecursion(ALGraph *G)  
{  
    int i, j, k;  
    stack st;  
　　 EdgeNode *p;
    for(i=0; i<G->n; i++)  
        visited[i]=FALSE;  
    for(i=0; i<G->n; i++)   // 遍历所有点，处理包括非连通图情况
        if(!visited[i])  
        {  
            visited[i]=TRUE;  
            printf("visit vertex：％c"，G->vexs[i])；//访问顶点vi
            push_stack(st, i);  
            k = i;
　　　　　　　while (!empty_stack(st)) { 
　　　　　　　　　 p = st.top();   
　　　　　　　　　 k = p->adjvex;
　　　　　　　　　 st.pop(); 
                for(j=0；j<G->n；j++)
                {  
                    if(G->edges[k][j]==1 && !visited[j])  
                    {  
                        visited[j]=TRUE;  
                        printf("visit vertex：％c"，G->vexs[j])；//访问顶点vi
                        st.push(j);
                        k = j;
                    }                     
                }
            }  
        }  
}

广度优先遍历(Breadth-FirstTraversal)

1、广度优先遍历的递归定义 　

设图G的初态是所有顶点均未访问过。在G中任选一顶点v为源点，则广度优先遍历可以定义为：首先访问出发点v，接着依次访问v的所有邻接点w1，w2，…，wt，然后再依次访问与wl，w2，…，wt邻接的所有未曾访问过的顶点。依此类推，直至图中所有和源点v有路径相通的顶点都已访问到为止。此时从v开始的搜索过程结束。　

若G是连通图，则遍历完成；否则，在图C中另选一个尚未访问的顶点作为新源点继续上述的搜索过程，直至G中所有顶点均已被访问为止。　

广度优先遍历类似于树的按层次遍历。采用的搜索方法的特点是尽可能先对横向进行搜索，故称其为广度优先搜索(Breadth-FirstSearch)。相应的遍历也就自然地称为广度优先遍历。

2、广度优先搜索过程 　

在广度优先搜索过程中，设x和y是两个相继要被访问的未访问过的顶点。它们的邻接点分别记为x1，x2，…，xs和y1，y2，…，yt。　

为确保先访问的顶点其邻接点亦先被访问，在搜索过程中使用FIFO队列来保存已访问过的顶点。当访问x和y时，这两个顶点相继入队。此后，当x和y相继出队时，我们分别从x和y出发搜索其邻接点x1，x2，…，xs和y1，y2，…，yt，对其中未访者进行访问并将其人队。这种方法是将每个已访问的顶点人队，故保证了每个顶点至多只有一次人队。

3、广度优先搜索算法

//(1)邻接表表示图的广度优先搜索算法
  void BFS(ALGraph*G，int k)
  {// 以vk为源点对用邻接表表示的图G进行广度优先搜索
    int i；
    CirQueue Q； //须将队列定义中DataType改为int
    EdgeNode *p；
    InitQueue(&Q)；//队列初始化
     //访问源点vk
     printf("visit vertex：％e"，G->adjlist[k].vertex)；
    visited[k]=TRUE； 
    EnQueue(&Q，k)；//vk已访问，将其人队。（实际上是将其序号人队）
    while(!QueueEmpty(&Q)){//队非空则执行
        i=DeQueue(&Q)； //相当于vi出队
        p=G->adjlist[i].firstedge； //取vi的边表头指针
        while(p){//依次搜索vi的邻接点vj(令p->adjvex=j)
            if(!visited[p->adivex]){ //若vj未访问过
              printf("visitvertex：％c"，C->adjlistlp->adjvex].vertex)； //访问vj
              visited[p->adjvex]=TRUE； 
              EnQueue(&Q，p->adjvex)；//访问过的vj人队
             }//endif
            p=p->next；//找vi的下一邻接点
         }//endwhile
      }//endwhile
   }//end of BFS 


//（2）邻接矩阵表示的图的广度优先搜索算法
  void BFSM(MGraph *G，int k)
  {// 以vk为源点对用邻接矩阵表示的图G进行广度优先搜索
   int i，j；
   CirQueue Q；
  InitQueue(&Q)；
   printf("visit vertex：％c"，G->vexs[k])； //访问源点vk
   visited[k]=TRUE；
   EnQueue(&Q，k)；
   while(!QueueEmpty(&Q)){
      i=DeQueue(&Q)； //vi出队
      for(j=0;j<G->n;j++)//依次搜索vi的邻接点vj
          if(G->edges[i][j]==1&&!visited[j]){//vi未访问
              printf("visit vertex：％c"，G->vexs[j])；//访问vi
              visited[j]=TRUE；
              EnQueue(&Q，j)；//访问过的vi人队
                 }
     }//endwhile
  }//BFSM

4、算法分析
　对于具有n个顶点和e条边的无向图或有向图，每个顶点均入队一次。广度优先遍历(BFSTraverse)图的时间复杂度和DFSTraverse算法相同。
　当图是连通图时，BFSTraverse算法只需调用一次BFS或BFSM即可完成遍历操作，此时BFS和BFSM的时间复杂度分别为O(n+e)和0(n²)。

【参考】http://sjjp.tjuci.edu.cn/sjjg/DataStructure/DS/web/tu/tu7.1.1.htm

posted @ 2015-01-23 15:48 小天_y 阅读(1105) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

小天_y

——May there be enough clouds in your life to make a beautiful sunset.

深度优先和广度优先搜索

公告