2017年7月2日

手动爬虫之京东笔记本栏(ptyhon3)

摘要: 1 import urllib.request as ur 2 import urllib.error as ue 3 import re 4 # 目标网址 5 url = 'https://list.jd.com/list.html?cat=670,671,672' 6 # 存放路径 7 save_path = 'E:/workspace/PyCharm/codeSpace/bo... 阅读全文

posted @ 2017-07-02 23:10 小明在线 阅读(337) 评论(0) 推荐(0)

手动爬虫之流程笔记1(python3)

摘要: 一、引入拓展库 由于刚刚起步学习爬虫,故从urllib库开始 首先引入urllib,这里主要用到urllib中request类 二、设置全局参数 我把它分为三个变量:代理服务器IP、目标网址、存放路径。 三、将爬虫模拟成浏览器访问页面 由于urlopen不支持一些HTTP的高级功能,所以要想达到预期 阅读全文

posted @ 2017-07-02 21:44 小明在线 阅读(267) 评论(0) 推荐(0)

导航