会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
swineherd_MCQ
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
6
7
8
9
10
11
下一页
2019年9月5日
python爬虫(5)——BeautifulSoup & docker基础
摘要: BeautifulSoup基础实战 安装:pip install beautifulsoup4 常用指令: PhantomJS基础实战 效率不高,但可以解决很多反爬问题,本质是一个无界面的浏览器,通过命令行(或python)操纵。通常难点部分通过PhantomJS写,然后将数据交给urllib或sc
阅读全文
posted @ 2019-09-05 19:22 MCQ1999
阅读(357)
评论(0)
推荐(0)
2019年9月4日
2016 ACM-ICPC Asia Regional Dalian Online HDU 5875 Function(线段树)
摘要: 题意 求区间l~r的a[l]%a[l+1]%……%a[r]的值 思路 因为取模的变化是很快的,所以线段树查找区间内第一个小于等于a[l]的数的位置,更新ans后继续查找即可。 注意查询满足某种条件的位置要这样写: int query(int L,int R,int l,int r,int rt,in
阅读全文
posted @ 2019-09-04 15:01 MCQ1999
阅读(157)
评论(0)
推荐(0)
2019年8月30日
python爬虫(4)——scrapy框架
摘要: 安装 urllib库更适合写爬虫文件,scrapy更适合做爬虫项目。 步骤: 1. 先更改pip源,国外的太慢了,参考:https://www.jb51.net/article/159167.htm 2. 升级pip:python m pip install upgrade pip 3. pip i
阅读全文
posted @ 2019-08-30 21:14 MCQ1999
阅读(566)
评论(0)
推荐(0)
2019CCPC网络选拔赛 hdu6703 array(主席树+set)
摘要: 题意 给你一个1~n的排列,由两种操作: 1 pos:将a[pos]+10 000 000 2 r k:求大于等于k且不等于a[1~r]的数的最小值。 强制在线。 思路 如果没有1操作,那么我们直接主席树就OK了。 考虑不真正的进行修改,每次1操作就把a[pos]插进set,因为加10 000 00
阅读全文
posted @ 2019-08-30 17:19 MCQ1999
阅读(234)
评论(0)
推荐(0)
2019年8月29日
2019 Multi-University Training Contest 1 String(序列自动机+贪心)
摘要: 题意 链接:https://vjudge.net/problem/HDU 6586 给你一个字符串和k,还有每个字符出现次数的限制,求一个长度为k的字典序最小的满足限制的子序列。 思路 先构造出序列自动机,顺带把num(i,j)(下标为i后面的字符为j的个数)求出来。 题目要求字典序最小,我们就贪心
阅读全文
posted @ 2019-08-29 15:58 MCQ1999
阅读(197)
评论(0)
推荐(0)
2019 Multi-University Training Contest 1 E Path(最短路+最小割)
摘要: 题意 链接:https://vjudge.net/problem/HDU 6582 给定一个有向图,可以有重边,每条边上有一个权值表示删掉这条边的代价,问最少花费多少代价能使从s到t节点的最短路径增大?1≤n,m≤10000 思路 容易想到应该是删最短路上的边,最短路可能不止一条,所以使原图1到n的
阅读全文
posted @ 2019-08-29 11:03 MCQ1999
阅读(214)
评论(0)
推荐(0)
2019年8月28日
ACM-ICPC 2018 南京赛区网络预赛 I. Skr(回文树)
摘要: 题意 https://nanti.jisuanke.com/t/A1955 求所有本质不同的回文串转成数后的和。 思路 如果了解回文树的构造原理,那么这题就很简单了,回文树每个结点代表一个回文串,每添加一个字符会在两端加上这个字符,我们只需要用res[]数组表示原串的前缀和,然后每添加一个字符的贡献
阅读全文
posted @ 2019-08-28 13:50 MCQ1999
阅读(215)
评论(0)
推荐(0)
2019年8月27日
ACM-ICPC 2018 沈阳赛区网络预赛 J. Ka Chang(树上分块+dfs序+线段树)
摘要: 题意 链接:https://nanti.jisuanke.com/t/A1998 给出一个有根树(根是1),有n个结点。初始的时候每个结点的值都是0.下面有q个操作,操作有两种,操作1.将深度为L(根节点深度为0)的点的值全部增加X。操作2.查询以x为根的子树的结点值得和。其中N,Qblock。 对
阅读全文
posted @ 2019-08-27 18:42 MCQ1999
阅读(543)
评论(0)
推荐(0)
2019年8月21日
python爬虫(3)——用户和IP代理池、抓包分析、异步请求数据、腾讯视频评论爬虫
摘要: 用户代理池 用户代理池就是将不同的用户代理组建成为一个池子,随后随机调用。 作用:每次访问代表使用的浏览器不一样 IP代理与IP代理池的构建的两种方案 搜索西刺、大象代理IP 尽量选国外的IP。 IP代理池构建的第一种方式(适合代理IP稳定的情况) IP代理池构建的第二种方式(接口调用法,更适合代理
阅读全文
posted @ 2019-08-21 13:24 MCQ1999
阅读(800)
评论(0)
推荐(0)
2019年8月19日
python爬虫(2)——urllib、get和post请求、异常处理、浏览器伪装
摘要: urllib基础 urlretrieve() urlretrieve(网址,本地文件存储地址) 直接下载网页到本地 urlcleanup() 清除缓存 info() 查看网页简介 getcode() 输出网页爬取状态码,200为正常,其他都不正常 geturl() 获取当前访问的网页的url 超时设
阅读全文
posted @ 2019-08-19 18:40 MCQ1999
阅读(905)
评论(0)
推荐(0)
上一页
1
···
6
7
8
9
10
11
下一页
公告