python爬虫 - 随笔分类 - 智、心

多线程爬取博拾贝

摘要：```python from bs4 import BeautifulSoup from urllib import request import threading import re import os from lxml import html class SpiderCategory(threading.Thread): #继承父类threading.Thread def __init__ 阅读全文

posted @ 2020-04-05 23:38 智、心阅读(133) 评论(0) 推荐(0)

麦田厦门小区信息数据爬取

摘要：刚开始爬取的时候没有用headers伪装成是浏览器，导致麦田北京和福州小区把我的ip给禁掉了，还好后来发现原因也还剩下厦门小区没被我弄坏，代码如下：阅读全文

posted @ 2019-08-26 22:28 智、心阅读(313) 评论(0) 推荐(0)

python爬取豆瓣电影top250数据存入数据库

摘要：结果：阅读全文

posted @ 2019-08-15 21:21 智、心阅读(1632) 评论(0) 推荐(0)

python爬取豆瓣电影top250数据存入excel

摘要：# -*- coding:utf-8 -*- """获取时光影评电影""" import requests from bs4 import BeautifulSoup from datetime import datetime,timedelta import pymysql #xlwt-1.3.0 #from xlwt.xlwt import * from xlwt import * #获取指... 阅读全文

posted @ 2019-08-14 01:04 智、心阅读(1571) 评论(0) 推荐(0)

智、心

随笔分类 - python爬虫

公告