摘要: 原文出处: Andrew_liu 本文希望达到以下目标: 初学Scrapy, 如有翻译不当, 或者代码错误, 请指出, 非常感谢 1. Scrapy简介 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。其最初是为了 阅读全文
posted @ 2017-09-05 16:30 追梦的独行者 阅读(341) 评论(0) 推荐(0) 编辑
摘要: 原文出处: Jecvay Notes (@Jecvay) 《零基础自学用Python 3开发网络爬虫(一)》 《零基础自学用Python 3开发网络爬虫(二)》 《零基础自学用Python 3开发网络爬虫(三)》 今天的工作很有意思, 我们用 Python 来登录网站, 用Cookies记录登录信息 阅读全文
posted @ 2017-09-05 16:10 追梦的独行者 阅读(445) 评论(0) 推荐(0) 编辑
摘要: commands是python2版本里的,在python3.0以上已经没有commands模块了,使用subprocess代替commands 阅读全文
posted @ 2017-09-05 15:46 追梦的独行者 阅读(16883) 评论(0) 推荐(1) 编辑
摘要: 原文出处: Andrew_liu python的网络变成比c语言简单许多, 封装许多底层的实现细节, 方便程序员使用的同时, 也使程序员比较难了解一些底层的东西, 我觉得学网络编程还是用c语言更好一点. 写这篇博文, 也希望回顾并整理一下以前学过的c语言和linux下一些东西, 会将一些Linux网 阅读全文
posted @ 2017-09-05 15:25 追梦的独行者 阅读(1420) 评论(0) 推荐(0) 编辑
摘要: 上一回, 我学会了 这一回, 开始用Python将伪代码中的所有部分实现. 由于文章的标题就是”零基础”, 因此会先把用到的两种数据结构队列和集合介绍一下. 而对于”正则表达式“部分, 限于篇幅不能介绍, 但给出我比较喜欢的几个参考资料. Python的队列 在爬虫程序中, 用到了广度优先搜索(BF 阅读全文
posted @ 2017-09-05 14:14 追梦的独行者 阅读(433) 评论(0) 推荐(0) 编辑
摘要: 原文出处: Jecvay Notes (@Jecvay) 由于本学期好多神都选了Cisco网络课, 而我这等弱渣没选, 去蹭了一节发现讲的内容虽然我不懂但是还是无爱. 我想既然都本科就出来工作还是按照自己爱好来点技能吧, 于是我就不去了. 一个人在宿舍没有点计划好的事情做就会很容易虚度, 正好这个学 阅读全文
posted @ 2017-09-05 11:07 追梦的独行者 阅读(1679) 评论(0) 推荐(0) 编辑
摘要: 1、从提示看这应该是你在本地电脑启用了代理服务,这行提示的大概意思是无法打开日志文件(logfile),所以出现了错误提示。 2、我也有同样的问题,同样的错误提示,我按照错误路径可以找到错误文件,是因为开机启动了VPN,你尝试关闭开机启动试一下,其实这个完全不影响使用 阅读全文
posted @ 2017-09-05 08:52 追梦的独行者 阅读(9674) 评论(0) 推荐(0) 编辑