2017 年 4月 2 日随笔档案 - 曾是土木人

2017年4月2日

摘要：首先，在items.py中定义几个字段用来保存网页数据（网址，标题，网页源码）如下所示：最重要的是我们的spider，我们这里的spider继承自CrawlSpider，方便我们定义正则来提示爬虫需要抓取哪些页面。如：爬去下一页，爬去各个文章在spdier中，我们使用parse_item方法阅读全文

posted @ 2017-04-02 21:55 曾是土木人阅读(2177) 评论(0) 推荐(0) 编辑

Ubuntu下将python从2.7升级到3.5

摘要：在ubuntu 的终端中用代码下载最新的Python 用命令删除usr/bin/目录下的默认python link文件给系统默认python编译器建立新的连接验证系统默认Python是否是刚才安装的直接在命令窗口输入python即可阅读全文

posted @ 2017-04-02 14:46 曾是土木人阅读(10790) 评论(1) 推荐(2) 编辑

曾是土木人

当你的才华还撑不起你的野心时,就应该静下心来学习

公告