2020 年 5月 8 日随笔档案 - 阿dun

摘要： Scrapy+selenium爬取简书全站环境 Ubuntu 18.04 Python 3.8 Scrapy 2.1 爬取内容文字标题作者作者头像发布日期内容文章连接文章ID 思路分析简书文章的url规则使用selenium请求页面使用xpath获取需要的数据异步存储数据到M 阅读全文

posted @ 2020-05-08 19:37 阿dun 阅读(1481) 评论(0) 推荐(0)

Loading