摘要: 昨天开始学习了爬虫的一些方法,有urliib,request和Scrapy,在爬取定位时用正则和xpath,综合比较,决定采用request和xpath的方法再次爬取图片和评论等相关的信息,也学习了代理池,在爬取时也用了代理池,防止被封ip。爬取的数据也会有些不规范,有多余空格等内容,对数据进行了初 阅读全文
posted @ 2020-02-05 19:08 格式化。 阅读(110) 评论(0) 推荐(0) 编辑