2018 年 6月 11 日随笔档案 - nick560

2018年6月11日

摘要： from selenium import webdriver from selenium.webdriver import ActionChains from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys from selenium.webdriver.suppor... 阅读全文

posted @ 2018-06-11 11:13 nick560 阅读(337) 评论(0) 推荐(0)

新浪微博爬虫项目

摘要：利用scrapy、proxy_pool、cookie_pool抓取新浪微博：用户信息、关注列表、粉丝列表、微博内容，信息保存至MongoDB。以几个大V为起点，爬取个人信息、粉丝、关注、微博信息，然后继续获取这些粉丝和关注的个人信息、粉丝、关注、微博信息，以此类推，实现递归爬取。 1、 spider 阅读全文

posted @ 2018-06-11 11:02 nick560 阅读(978) 评论(0) 推荐(0)

nick560

公告