会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
xmwd
博客园
首页
新随笔
联系
订阅
管理
2017年6月1日
Python实现的异步代理爬虫及代理池2--正确实现并发
摘要: 相关博客: "Python实现的异步代理爬虫及代理池1 基本功能" 在啃完 "《流畅的Python》" 之后,发现我之前实现的 "proxypool" 是有问题的:它虽然使用了 的,但却不是并发的,依旧是顺序的,所以运行的速度非常慢。在实现并发后,按照现有的5个规则爬取一次这5个代理网站目前用时 不
阅读全文
posted @ 2017-06-01 15:59 xmwd
阅读(2689)
评论(0)
推荐(0)
2017年3月16日
Python实现的异步代理爬虫及代理池1--基本功能
摘要: 使用python asyncio实现了一个异步代理池,根据规则爬取代理网站上的免费代理,在验证其有效后存入redis中,定期扩展代理的数量并检验池中代理的有效性,移除失效的代理。同时用aiohttp实现了一个server,其他的程序可以通过访问相应的url来从代理池中获取代理。 源码 "Github
阅读全文
posted @ 2017-03-16 21:15 xmwd
阅读(2582)
评论(2)
推荐(1)
2017年3月14日
aiohttp之添加静态资源路径
摘要: 所谓静态资源,是指图片、js、css等文件。官方的说明在 "这里" 。 以一个小项目来说明,下面是项目的目录结构: 在 给2个静态文件目录 和`static/font`添加路由: 先来看看 方法的定义: 必需的2个参数: :是静态文件的 的前缀,以 开始,在浏览器地址栏上显示在网站host之后,也用
阅读全文
posted @ 2017-03-14 20:30 xmwd
阅读(2480)
评论(0)
推荐(0)
2017年2月19日
python实现的基于蒙特卡洛树搜索(MCTS)与UCT RAVE的五子棋游戏
摘要: 更新 2017.2.23有更新,见文末。 MCTS与UCT 下面的内容引用自徐心和与徐长明的论文《计算机博弈原理与方法学概述》: 蒙特卡洛模拟对局就是从某一棋局出发,随机走棋。有人形象地比喻,让两个傻子下棋,他们只懂得棋规,不懂得策略,最终总是可以决出胜负。这个胜负是有偶然性的。但是如果让成千上万对
阅读全文
posted @ 2017-02-19 15:04 xmwd
阅读(28361)
评论(11)
推荐(2)
2016年9月23日
C++ 事件驱动型银行排队模拟
摘要: 最近重拾之前半途而废的C++,恰好看到了《 "C++ 实现银行排队服务模拟" 》,但是没有实验楼的会员,看不到具体的实现,正好用来作为练习。 模拟的是银行的排队叫号系统,所有顾客以先来后到的顺序在同一个队列中等待,当有服务窗口空闲时,则队首的顾客接受服务,完成后则下一位顾客开始接受服务。 本实现是事
阅读全文
posted @ 2016-09-23 21:48 xmwd
阅读(4540)
评论(0)
推荐(1)
2016年3月13日
Scrapy:为spider指定pipeline
摘要: 当有多个spider和pipeline时,为spider指定pipeline
阅读全文
posted @ 2016-03-13 19:34 xmwd
阅读(1221)
评论(0)
推荐(0)
2016年2月28日
scrapy cookies:将cookies保存到文件以及从文件加载cookies
摘要: 将scrapy获取到的cookies保存到文件;从文件中获取cookies并在请求时发送出去。可以用于模拟登录。
阅读全文
posted @ 2016-02-28 09:48 xmwd
阅读(6513)
评论(1)
推荐(1)
2016年1月30日
设置nginx禁止IP直接访问,只能通过指定的域名访问
摘要: nginx的版本是1.2.1。 设置配置文件disableip.conf: server { listen 80; server_name _; return500; } 这是最终使用的配置文件,也是网上找到的常见的配置之一,最初该conf文件在sites-available文件夹下,尝试使用各种参
阅读全文
posted @ 2016-01-30 22:29 xmwd
阅读(1770)
评论(0)
推荐(0)
公告