摘要:
from selenium import webdriver from selenium.webdriver import ActionChains from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys from selenium.webdriver.suppor... 阅读全文
posted @ 2018-06-11 11:13
nick560
阅读(332)
评论(0)
推荐(0)
摘要:
利用scrapy、proxy_pool、cookie_pool抓取新浪微博:用户信息、关注列表、粉丝列表、微博内容,信息保存至MongoDB。以几个大V为起点,爬取个人信息、粉丝、关注、微博信息,然后继续获取这些粉丝和关注的个人信息、粉丝、关注、微博信息,以此类推,实现递归爬取。 1、 spider 阅读全文
posted @ 2018-06-11 11:02
nick560
阅读(973)
评论(0)
推荐(0)