2020 年 2月 5 日随笔档案 - 格式化。

2020年2月5日

摘要：昨天开始学习了爬虫的一些方法，有urliib，request和Scrapy，在爬取定位时用正则和xpath，综合比较，决定采用request和xpath的方法再次爬取图片和评论等相关的信息，也学习了代理池，在爬取时也用了代理池，防止被封ip。爬取的数据也会有些不规范，有多余空格等内容，对数据进行了初阅读全文

posted @ 2020-02-05 19:08 格式化。阅读(116) 评论(0) 推荐(0)

格式化。

公告