摘要: pandas学习中文文档 阅读全文
posted @ 2019-08-13 22:48 笑得好美 阅读(900) 评论(0) 推荐(0)
摘要: 1 """ 2 菜鸟教程:https://www.runoob.com/numpy/numpy-tutorial.html 3 NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。 4 5 "" 阅读全文
posted @ 2019-08-13 18:06 笑得好美 阅读(355) 评论(0) 推荐(0)
摘要: 增量式爬虫通过爬虫程序监测某网站数据更新的情况,以便可以爬取到该网站更新出的新数据。增量式爬虫核心在于跳过之前已经爬去过的数据,也就是实现请求去重! 去重方法 将爬取过程中产生的url进行存储,存储在redis的set中。当下次进行数据爬取时,首先对即将要发起的请求对应的url在存储的url的set 阅读全文
posted @ 2019-08-13 00:04 笑得好美 阅读(610) 评论(0) 推荐(0)