随笔分类 -  python

摘要:一、爬取前准备 1、IDE使用pycharm 2、安装相关的库,requests,re,xlsxwritter,beautifulsoup 3、分析杭州教育地图网页结构 如图看到,网页由顶部的区域,中间的学校列表和底部的分页等几个重要的部分组成。查看网页源码,可以看到上述的三个部分都可以在页面中找到 阅读全文
posted @ 2018-09-25 14:24 mangata 阅读(269) 评论(0) 推荐(0)
摘要:python爬取imdb top250 1、前期准备 pycharm,请求库使用urllib.requests,解析库使用beautifulsoup 2、代码展示 from urllib import request from bs4 import BeautifulSoup response=re 阅读全文
posted @ 2018-08-12 18:10 mangata 阅读(337) 评论(0) 推荐(0)