随笔分类 -  爬虫

python爬虫集合
摘要:参考爬取思路代码如下: 阅读全文
posted @ 2018-06-20 13:05 点点花飞谢 阅读(191) 评论(0) 推荐(0)
摘要:from urllib import request from time import sleep from lxml import etree import csv # import random #sleep(random.random(1)*2) 随机秒数 # 参数部分 # sz_url = 'https://sz.lianjia.com/zufang/' # # header ... 阅读全文
posted @ 2018-06-20 12:59 点点花飞谢 阅读(334) 评论(0) 推荐(0)
摘要:import requests import re #正则表达式库导入倒推部分下载文件的代码url='http://zhangmenshiting.qianqian.com/data2/music/6c03fa42a322f8ad3c78eebe9f2b4211/594781778/59478177 阅读全文
posted @ 2018-06-20 12:56 点点花飞谢 阅读(250) 评论(0) 推荐(0)
摘要:# -*- coding:utf-8 -*-from urllib import request as urllib2import re# 利用正则表达式爬取内涵段子url = r'http://www.neihanpa.com/article/list_5_{}.html'headers = { 阅读全文
posted @ 2018-06-02 16:36 点点花飞谢 阅读(339) 评论(0) 推荐(0)