上一页 1 ··· 6 7 8 9 10 11 下一页
摘要: BeautifulSoup基础实战 安装:pip install beautifulsoup4 常用指令: PhantomJS基础实战 效率不高,但可以解决很多反爬问题,本质是一个无界面的浏览器,通过命令行(或python)操纵。通常难点部分通过PhantomJS写,然后将数据交给urllib或sc 阅读全文
posted @ 2019-09-05 19:22 MCQ1999 阅读(357) 评论(0) 推荐(0)
摘要: 题意 求区间l~r的a[l]%a[l+1]%……%a[r]的值 思路 因为取模的变化是很快的,所以线段树查找区间内第一个小于等于a[l]的数的位置,更新ans后继续查找即可。 注意查询满足某种条件的位置要这样写: int query(int L,int R,int l,int r,int rt,in 阅读全文
posted @ 2019-09-04 15:01 MCQ1999 阅读(157) 评论(0) 推荐(0)
摘要: 安装 urllib库更适合写爬虫文件,scrapy更适合做爬虫项目。 步骤: 1. 先更改pip源,国外的太慢了,参考:https://www.jb51.net/article/159167.htm 2. 升级pip:python m pip install upgrade pip 3. pip i 阅读全文
posted @ 2019-08-30 21:14 MCQ1999 阅读(566) 评论(0) 推荐(0)
摘要: 题意 给你一个1~n的排列,由两种操作: 1 pos:将a[pos]+10 000 000 2 r k:求大于等于k且不等于a[1~r]的数的最小值。 强制在线。 思路 如果没有1操作,那么我们直接主席树就OK了。 考虑不真正的进行修改,每次1操作就把a[pos]插进set,因为加10 000 00 阅读全文
posted @ 2019-08-30 17:19 MCQ1999 阅读(234) 评论(0) 推荐(0)
摘要: 题意 链接:https://vjudge.net/problem/HDU 6586 给你一个字符串和k,还有每个字符出现次数的限制,求一个长度为k的字典序最小的满足限制的子序列。 思路 先构造出序列自动机,顺带把num(i,j)(下标为i后面的字符为j的个数)求出来。 题目要求字典序最小,我们就贪心 阅读全文
posted @ 2019-08-29 15:58 MCQ1999 阅读(197) 评论(0) 推荐(0)
摘要: 题意 链接:https://vjudge.net/problem/HDU 6582 给定一个有向图,可以有重边,每条边上有一个权值表示删掉这条边的代价,问最少花费多少代价能使从s到t节点的最短路径增大?1≤n,m≤10000 思路 容易想到应该是删最短路上的边,最短路可能不止一条,所以使原图1到n的 阅读全文
posted @ 2019-08-29 11:03 MCQ1999 阅读(214) 评论(0) 推荐(0)
摘要: 题意 https://nanti.jisuanke.com/t/A1955 求所有本质不同的回文串转成数后的和。 思路 如果了解回文树的构造原理,那么这题就很简单了,回文树每个结点代表一个回文串,每添加一个字符会在两端加上这个字符,我们只需要用res[]数组表示原串的前缀和,然后每添加一个字符的贡献 阅读全文
posted @ 2019-08-28 13:50 MCQ1999 阅读(215) 评论(0) 推荐(0)
摘要: 题意 链接:https://nanti.jisuanke.com/t/A1998 给出一个有根树(根是1),有n个结点。初始的时候每个结点的值都是0.下面有q个操作,操作有两种,操作1.将深度为L(根节点深度为0)的点的值全部增加X。操作2.查询以x为根的子树的结点值得和。其中N,Qblock。 对 阅读全文
posted @ 2019-08-27 18:42 MCQ1999 阅读(543) 评论(0) 推荐(0)
摘要: 用户代理池 用户代理池就是将不同的用户代理组建成为一个池子,随后随机调用。 作用:每次访问代表使用的浏览器不一样 IP代理与IP代理池的构建的两种方案 搜索西刺、大象代理IP 尽量选国外的IP。 IP代理池构建的第一种方式(适合代理IP稳定的情况) IP代理池构建的第二种方式(接口调用法,更适合代理 阅读全文
posted @ 2019-08-21 13:24 MCQ1999 阅读(800) 评论(0) 推荐(0)
摘要: urllib基础 urlretrieve() urlretrieve(网址,本地文件存储地址) 直接下载网页到本地 urlcleanup() 清除缓存 info() 查看网页简介 getcode() 输出网页爬取状态码,200为正常,其他都不正常 geturl() 获取当前访问的网页的url 超时设 阅读全文
posted @ 2019-08-19 18:40 MCQ1999 阅读(905) 评论(0) 推荐(0)
上一页 1 ··· 6 7 8 9 10 11 下一页