随笔分类 -  python

摘要:前一段时间是爬文字,最近准备爬图片 找到了两种保存文件的方法 一种是用urllib.urlretrieve方法 这个回调函数还是蛮方便的,在下大文件的时候,能够直观的看到下载情况 还有一个是用open和write方法来下载 阅读全文
posted @ 2017-04-08 10:54 安筱雨 阅读(491) 评论(0) 推荐(0)
摘要:昨天准备爬取一个京东商品的价格,正则写好了一直是空的 后来我去页面里面看了下,价格标签里果然是空的 百度了下,大家都说是js来控制显示价格的 于是去抓包试试,找到了一条mgets的请求 中间很多参数不知道是什么意思,但是skuIds就是商品的编号 去掉其他参数,只保留编号 https://p.3.c 阅读全文
posted @ 2017-03-31 10:31 安筱雨 阅读(8337) 评论(9) 推荐(2)
摘要:安装MySQLdb,请访问 http://sourceforge.net/projects/mysql-python 我的是2.7版本的MySQL-python-1.2.4b4.win32-py2.7 直接运行就能安装了 阅读全文
posted @ 2017-03-30 21:51 安筱雨 阅读(211) 评论(0) 推荐(0)
摘要:最近偶尔学下爬虫,放上第二个demo吧 阅读全文
posted @ 2017-03-16 11:12 安筱雨 阅读(231) 评论(0) 推荐(0)
摘要:# -*- coding: utf-8 -*- from splinter.browser import Browser from time import sleep import traceback #初始化信息 # 用户名,密码 username = u"用户名" passwd = u"密码" # cookies值得自己去找 starts = u"杭州,HZH" ends = u"黄石... 阅读全文
posted @ 2017-03-14 22:47 安筱雨 阅读(449) 评论(0) 推荐(0)
摘要:#-*- coding: utf-8 -*- import urllib import urllib2 import re #页面为1 page=1 url='http://www.qiushibaike.com/hot/page/'+str(page) #需要header验证 user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows ... 阅读全文
posted @ 2017-03-11 16:16 安筱雨 阅读(152) 评论(0) 推荐(0)
摘要:from selenium import webdriverChromeDriver="C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe"driver = webdriver.Chrome(ChromeDriver)d 阅读全文
posted @ 2017-03-08 14:23 安筱雨 阅读(144) 评论(0) 推荐(0)
摘要:我下的python2.7是有pip的,但是直接在cmd中输入pip是无响应的.要去环境变量中配置D:/python/Script 这样就可以了。 pip install splinter就能下载了 阅读全文
posted @ 2017-03-08 11:00 安筱雨 阅读(351) 评论(0) 推荐(0)