随笔分类 - python
摘要:前一段时间是爬文字,最近准备爬图片 找到了两种保存文件的方法 一种是用urllib.urlretrieve方法 这个回调函数还是蛮方便的,在下大文件的时候,能够直观的看到下载情况 还有一个是用open和write方法来下载
阅读全文
摘要:昨天准备爬取一个京东商品的价格,正则写好了一直是空的 后来我去页面里面看了下,价格标签里果然是空的 百度了下,大家都说是js来控制显示价格的 于是去抓包试试,找到了一条mgets的请求 中间很多参数不知道是什么意思,但是skuIds就是商品的编号 去掉其他参数,只保留编号 https://p.3.c
阅读全文
摘要:安装MySQLdb,请访问 http://sourceforge.net/projects/mysql-python 我的是2.7版本的MySQL-python-1.2.4b4.win32-py2.7 直接运行就能安装了
阅读全文
摘要:# -*- coding: utf-8 -*- from splinter.browser import Browser from time import sleep import traceback #初始化信息 # 用户名,密码 username = u"用户名" passwd = u"密码" # cookies值得自己去找 starts = u"杭州,HZH" ends = u"黄石...
阅读全文
摘要:#-*- coding: utf-8 -*- import urllib import urllib2 import re #页面为1 page=1 url='http://www.qiushibaike.com/hot/page/'+str(page) #需要header验证 user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows ...
阅读全文
摘要:from selenium import webdriverChromeDriver="C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe"driver = webdriver.Chrome(ChromeDriver)d
阅读全文
摘要:我下的python2.7是有pip的,但是直接在cmd中输入pip是无响应的.要去环境变量中配置D:/python/Script 这样就可以了。 pip install splinter就能下载了
阅读全文

浙公网安备 33010602011771号