搜索(dfs)

如果你的时间比较紧,建议直接从第4段开始看

 

深度优先搜索是一种在开发爬虫早期使用较多的方法。它的目的是要达到被搜索结构的叶结点(即那些不包含任何超链的HTML文件 。在一个HTML文件中,当一个超链被选择后,被链接的HTML文件将执行深度优先搜索,即在搜索其余的超链结果之前必须先完整地搜索单独的一条链。深度优先搜索沿着HTML文件上的超链走到不能再深入为止,然后返回到某一个HTML文件,再继续选择该HTML文件中的其他超链。当不再有其他超链可选择时,说明搜索已经结束。ps:看不懂没关系,毕竟我看不懂。(这段文字摘自百度百科。)

 

必须要说,搜索不是简简单单看一篇博客就能明白的,需要经验累计才能理解。

搜索分为dfs(深度优先搜索)和bfs(广度优先搜索)两种,而这两种方式可以说差别比较大,所以要分开说。

 

在学习搜索之前,建议先明白图的定义:https://www.cnblogs.com/chen-1/p/12335809.html

 

dfs(深搜):

dfs是基于递归的一种搜索,所以它的实现是自己调用自己,一步一步向深处搜索,当出现死路时就“退一步”(专业来讲叫回溯),直到出现一条活路,然后

就沿着这条路一直搜下,直到出现死路再回溯。如此循环往复,直到嵌套的递归条件生效并停止这次深搜。堪称“不撞南墙不回头”啊。

这是一个比较直观的搜索流程

以上就是dfs对一张图的遍历了

现在讲完dfs算法了,接下来可以练几道dfs好题

https://www.luogu.com.cn/problem/P1706 全排列问题

详解:用一个dfs递归函数来枚举,在这道题中,图的深度就是该全排列确定到第几位,每次往“深”dfs就是确定完第x位后枚举第x+1位的数字可以取几,唯

一有所不同的是这道题还要开一个bool数组,记录到目前为止,数i是否被用过,以便枚举

其中idx表示枚举到了第idx位,ans用于记录答案,flag判断这个数是否被用过,而dfs(idx+1)后面那两句ans[i]=0,flag[i]=0是用于回溯,如果第idx为并没有取

数i,则flag与ans都要改变。

void dfs(int idx)//dfs枚举 
{
    if(idx>n)//如果把所有数都用上了,即已经生成一个全排列了 
    {
        for(int i=1;i<=n;i++)
        {
            printf("%5d",ans[i]);
        }
        cout<<endl;
        //生成成功后直接输出 
        return;
        //return必不可少,否则不断枚举下去,会死循环 
    }
    for(int i=1;i<=n;i++)
    {
        if(flag[i]) continue;//如果该数字被用过,直接跳过即可
        flag[i]=1;//标记这个数已经被用过 
        ans[idx]=i;//记录答案 
        dfs(idx+1);//往深枚举 
        flag[i]=0;
        ans[idx]=0;//回溯 
    }
}

这是一道最简单的dfs了,简直是模板级的。

 

当然,还有别的较难的题

https://loj.ac/problem/10018数的划分等等

https://loj.ac/problems/search?keyword=1.3

 

这里面除了A+B problem以外都是比较有意思的深搜题,建议大家多去刷一刷,十分有助于提高水平!

posted @ 2020-02-19 13:14  CZD648  阅读(394)  评论(0编辑  收藏  举报
Live2D