随笔分类 -  爬虫

一个超实用的python爬虫功能使用 requests BeautifulSoup
摘要:一个简单的数据爬取的示例 import os,re import requests import random import time from bs4 import BeautifulSoup user_agent_list = [ "Mozilla/5.0 (Windows NT 6.1; WO 阅读全文

posted @ 2019-07-27 23:18 耀扬 阅读(569) 评论(0) 推荐(0)

selenium安装以chrome为例
摘要:selenium 是一套完整的web应用程序测试系统,包含了测试的录制(selenium IDE),编写及运行(Selenium Remote Control)和测试的并行处理(Selenium Grid)。Selenium的核心Selenium Core基于JsUnit,完全由JavaScript 阅读全文

posted @ 2018-04-28 16:23 耀扬 阅读(284) 评论(0) 推荐(0)

spider爬取拉勾网
摘要:兴奋的开发除了爬取拉勾网的爬虫信息,可是当调试都成功了的那一刻,我被拉钩封IP了。 下面是spider的主要内容 import reimport scrapy from bs4 import BeautifulSoupfrom scrapy.http import Request from lago 阅读全文

posted @ 2017-03-06 11:15 耀扬 阅读(177) 评论(0) 推荐(0)

win7下scrapy1.3.2安装
摘要:刚开始学爬虫,网上搜了搜,目前最合适的是选scrapy。 先要安装scrapy。 很多的博客上用的教程都说,scrapy目前对python3支持不是很好。可是不能不学3啊。 先用anaconda最新版本4.3.2 import scrapy 发现报错! 直接上 pip install scrapy, 阅读全文

posted @ 2017-03-04 10:29 耀扬 阅读(592) 评论(0) 推荐(0)

导航