摘要: 把网站装进爬虫里,分为几步: 新建项目 (Project):新建一个新的爬虫项目 明确目标(Items):明确你想要抓取的目标 制作爬虫(Spider):制作爬虫开始爬取网页 存储内容(Pipeline):设计管道存储爬取内容 1.新建项目(Project) 在空目录下按住Shift键右击,选择“在 阅读全文
posted @ 2017-12-21 17:49 cynthialy 阅读(2288) 评论(0) 推荐(0) 编辑
摘要: piwik 阅读全文
posted @ 2017-12-19 13:09 cynthialy 阅读(3541) 评论(0) 推荐(0) 编辑
摘要: Python基础知识:Learn Python the Hard Way W3Schools: www.w3schools.com/ JavaScript:JavaScript DOM编程艺术 HTML & CSS : Head First HTML与CSS(第2版) HTTP协议学习资料:In I 阅读全文
posted @ 2017-12-15 14:06 cynthialy 阅读(160) 评论(0) 推荐(0) 编辑
摘要: 正则表达式 阅读全文
posted @ 2017-12-13 17:16 cynthialy 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 感谢知乎小段同学,希望以此文飨大家,大家从此不再因为选择版本、安装Python、管理环境、添加第三方库(能用conda用conda,不能用conda用pip)、选择IDE(单文件Jupyter,项目组织开Pycharm)等等杂事所困扰,专心于代码。 阅读全文
posted @ 2017-12-13 11:41 cynthialy 阅读(6034) 评论(1) 推荐(0) 编辑
摘要: 这个星期开始学习Python了,因为看的书都是基于Python2.x,而且我安装的是Python3.1,所以书上写的地方好多都不适用于Python3.1,特意在Google上search了一下3.x和2.x的区别。特此在自己的空间中记录一下,以备以后查找方便,也可以分享给想学习Python的frie 阅读全文
posted @ 2017-11-27 17:15 cynthialy 阅读(1948) 评论(0) 推荐(0) 编辑
摘要: python格式化字符 阅读全文
posted @ 2017-11-22 17:47 cynthialy 阅读(250) 评论(0) 推荐(0) 编辑
摘要: python 中文输入的注意事项 解决中文输入的两种应用: 在脚本中加语言编码声明 “-*- coding: uft-8 -*-” 应用一:print中出现中文 方法一:用unicode(' ', encoding = 'utf-8' ) 或者 unicode(" ", encoding = "ut 阅读全文
posted @ 2017-11-22 16:56 cynthialy 阅读(9563) 评论(0) 推荐(0) 编辑
摘要: 数组相关更新操作 3. $push 用来增加数组。若没有改列,则会自动增加。 > db.tianyc03.find(){ "_id" : ObjectId("50ea6b6f12729d90ce6e341b"), "age" : 16, "name" : "xtt" } > db.tianyc03. 阅读全文
posted @ 2017-11-16 13:34 cynthialy 阅读(1374) 评论(0) 推荐(0) 编辑
摘要: mongodb update 字符操作 阅读全文
posted @ 2017-11-16 09:54 cynthialy 阅读(840) 评论(0) 推荐(0) 编辑