随笔分类 - python爬虫
摘要:```python from bs4 import BeautifulSoup from urllib import request import threading import re import os from lxml import html class SpiderCategory(threading.Thread): #继承父类threading.Thread def __init__
阅读全文
摘要:刚开始爬取的时候没有用headers伪装成是浏览器,导致麦田北京和福州小区把我的ip给禁掉了,还好后来发现原因也还剩下厦门小区没被我弄坏,代码如下:
阅读全文
摘要:# -*- coding:utf-8 -*- """获取时光影评电影""" import requests from bs4 import BeautifulSoup from datetime import datetime,timedelta import pymysql #xlwt-1.3.0 #from xlwt.xlwt import * from xlwt import * #获取指...
阅读全文

浙公网安备 33010602011771号