摘要: 1.爬虫的基本流程: 通过requests库的get方法获得网站的url 浏览器打开网页源码分析元素节点 通过BeautifulSoup或者正则表达式提取想要的数据 储存数据到本地磁盘或者数据库 2.正式开工啦 url = “http://www.jianshu.com” page = reques 阅读全文
posted @ 2018-05-03 16:39 遗世独立的愚公 阅读(352) 评论(0) 推荐(0)