随笔分类 -  python爬虫

摘要:```python from bs4 import BeautifulSoup from urllib import request import threading import re import os from lxml import html class SpiderCategory(threading.Thread): #继承父类threading.Thread def __init__ 阅读全文
posted @ 2020-04-05 23:38 智、心 阅读(133) 评论(0) 推荐(0)
摘要:刚开始爬取的时候没有用headers伪装成是浏览器,导致麦田北京和福州小区把我的ip给禁掉了,还好后来发现原因也还剩下厦门小区没被我弄坏,代码如下: 阅读全文
posted @ 2019-08-26 22:28 智、心 阅读(312) 评论(0) 推荐(0)
摘要:结果: 阅读全文
posted @ 2019-08-15 21:21 智、心 阅读(1631) 评论(0) 推荐(0)
摘要:# -*- coding:utf-8 -*- """获取时光影评电影""" import requests from bs4 import BeautifulSoup from datetime import datetime,timedelta import pymysql #xlwt-1.3.0 #from xlwt.xlwt import * from xlwt import * #获取指... 阅读全文
posted @ 2019-08-14 01:04 智、心 阅读(1569) 评论(0) 推荐(0)