上一页 1 ··· 6 7 8 9 10 11 12 13 下一页
摘要: https://docs.python.org/2/library/re.html##!/usr/bin/python#-*-coding:utf8-*- """@author: yugengde@contact: yugengde@163.com@file : re.py@time: 2017/8 阅读全文
posted @ 2017-08-07 22:09 yugengde 阅读(178) 评论(0) 推荐(0)
摘要: mongoDB 3.2之后默认是使用wireTiger引擎 在启动时更改存储引擎: mongod --storageEngine mmapv1 --dbpath d:\data\db 这样就可以解决mongvue不能查看文档的问题啦! 项目流程(步骤): 前去准备(安装scrapy pymongo 阅读全文
posted @ 2017-08-03 23:40 yugengde 阅读(213) 评论(0) 推荐(0)
摘要: 1. 首先导入工具from scrapy.selector import Selector2. selectors的使用实例:response.selector.xpath('//span/text()').extract() (1)选择title标签中text的文本内容 response.sele 阅读全文
posted @ 2017-08-02 23:34 yugengde 阅读(249) 评论(0) 推荐(0)
摘要: 默认指定目录安装目录下,新建/data/db #> mogod 或者(数据库启动) #>mongod --dbpath D:\data\db #> ./mongod --shutdown (关闭) 作为守护进程注入后台 ./mongod -f 配置文件 配置文件(实例):mongo.conf 数据库 阅读全文
posted @ 2017-08-01 23:03 yugengde 阅读(378) 评论(0) 推荐(0)
摘要: scrapy 框架 response的解析 阅读全文
posted @ 2017-08-01 21:07 yugengde 阅读(209) 评论(0) 推荐(0)
摘要: scrapy爬虫 企业级爬虫:python开发的一个快速,高层次的web抓取框架,用于抓取web站点并从页面提取结构化的数据。 scrapy用途广泛,可用于数据挖掘,数据监测和自动化测试 http://scrapy.org/ scrapy startproject proName scrapy ge 阅读全文
posted @ 2017-07-30 18:41 yugengde 阅读(153) 评论(0) 推荐(0)
摘要: from lxml import etreedoubanhtml = ''''''doc = etree.fromstring(doubanhtml)for eachbook in doc.xpath('//dl/dd'): bookname = eachbook.xpath('a/text()') 阅读全文
posted @ 2017-07-30 08:47 yugengde 阅读(236) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2017-07-30 00:48 yugengde 阅读(2) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2017-07-29 19:51 yugengde 阅读(1) 评论(0) 推荐(0)
上一页 1 ··· 6 7 8 9 10 11 12 13 下一页