随笔分类 -  python

python_webscraping
摘要:1.登陆超星慕课,chrome抓包,模拟header,提取表单隐藏元素构成params。 主要是验证码图片地址,在js中发现由js->new Date().getTime()时间戳动态生成url,python对应time.time(),生成验证码图片url,图片下载在本地,手动输入。代码如下: 2. 阅读全文
posted @ 2016-08-20 20:27 不被女生喜欢好多年 阅读(1401) 评论(0) 推荐(0)
摘要:import pymysql import requests from bs4 import BeautifulSoup#pymysql链接数据库 conn=pymysql.connect(host='127.0.1',unix_socket='/tmp/mysql.sock',user='root',passwd='19950311',db='mysql') cur=conn.cursor()... 阅读全文
posted @ 2016-08-12 18:05 不被女生喜欢好多年 阅读(568) 评论(0) 推荐(0)
摘要:#coding=utf-8 #python_demo 爬取煎蛋妹子图在本地文件夹 import requests import threading import time import os from bs4 import BeautifulSoup #伪造头文件 headers = { 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac O... 阅读全文
posted @ 2016-07-29 22:04 不被女生喜欢好多年 阅读(933) 评论(1) 推荐(0)