摘要: 当使用爬虫URL保存时,一般会选择set来保存urls,set是集合,集合中的元素不能重复,其次还有交集,并集等集合的功能, 爬虫每次获取的网页中提取网页中的urls,并保存,这就需要利用 下面展示一下HTML解析器代码 其次需要注意的是set可以add,而list不可以 阅读全文
posted @ 2018-08-25 16:52 大大的大笨熊 阅读(279) 评论(0) 推荐(0)