摘要: # *_*coding:utf-8 *_* import urllib.request from lxml import etree import requests def requests_view(response): request_url = response.url base_url = ' ' % (request_url) base_url = ba... 阅读全文
posted @ 2018-09-22 17:00 brady-wang 阅读(378) 评论(0) 推荐(0)
摘要: 获取文件的总数 阅读全文
posted @ 2018-09-22 10:53 brady-wang 阅读(284) 评论(0) 推荐(0)
摘要: scrapy shell https:///www.baidu.com 会启动爬虫请求网页 view(response) 会在浏览器打开请求到的临时文件 response.xpath("//*[@id="lh"]/a[2]/text()").extract() 使用xpath解析 阅读全文
posted @ 2018-09-22 10:52 brady-wang 阅读(548) 评论(0) 推荐(0)