欢迎来到Louis的博客

人生三从境界:昨夜西风凋碧树,独上高楼,望尽天涯路。 衣带渐宽终不悔,为伊消得人憔悴。 众里寻他千百度,蓦然回首,那人却在灯火阑珊处。
扩大
缩小

2018年4月4日

python random模块(随机数)

摘要: random.random random.random()用于生成一个0到1的随机符点数: 0 <= n < 1.0 random.uniform random.uniform的函数原型为:random.uniform(a, b),用于生成一个指定范围内的随机符点数,两个参数其中一个是上限,一个是下 阅读全文

posted @ 2018-04-04 10:59 Louiszj 阅读(468) 评论(0) 推荐(0) 编辑

python 爬取5566图库图片

摘要: python 爬取5566图库图片 1 import requests 2 import random 3 import re 4 import time 5 import os 6 from bs4 import BeautifulSoup 7 8 9 class GetGirlsPhoto(object): 10 def __init__(s... 阅读全文

posted @ 2018-04-04 10:54 Louiszj 阅读(845) 评论(1) 推荐(0) 编辑

2018年4月2日

[转][python] 常用正则表达式爬取网页信息及分析HTML标签总结

摘要: 转载至:https://blog.csdn.net/Eastmount/article/details/51082253 这篇文章主要是介绍Python爬取网页信息时,经常使用的正则表达式及方法。它是一篇总结性文章,实用性比较大,主要解决自己遇到的爬虫问题,也希望对你有所帮助~当然如果会Seleni 阅读全文

posted @ 2018-04-02 12:48 Louiszj 阅读(1402) 评论(0) 推荐(0) 编辑

2018年3月28日

[转]python爬虫实例项目大全

摘要: WechatSogou [1]- 微信公众号爬虫。基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典。 【2018年3月28日 完成】DouBanSpider [2]- 豆瓣读书爬虫。可以爬下豆瓣读书标签下的所有图书,按评分排名依次存储, 阅读全文

posted @ 2018-03-28 14:13 Louiszj 阅读(356) 评论(0) 推荐(0) 编辑

Python 爬取笔趣看小说

摘要: # -*- coding:utf-8 -*- from bs4 import BeautifulSoup import requests import sys class DownLoader(object): def __init__(self): self.server = 'http://www.biqukan.com/' self.target... 阅读全文

posted @ 2018-03-28 12:23 Louiszj 阅读(951) 评论(0) 推荐(0) 编辑

python 爬取豆瓣图书

摘要: #!-*-coding:utf-8-*- import requests import xlwt from bs4 import BeautifulSoup from collections import OrderedDict class DouBanBookSpider(object): def __init__(self, book_type, quantity): ... 阅读全文

posted @ 2018-03-28 12:20 Louiszj 阅读(614) 评论(0) 推荐(0) 编辑

2018年3月26日

Beautiful Soup 4.4.0 文档

摘要: http://beautifulsoup.readthedocs.io/zh_CN/latest/ 阅读全文

posted @ 2018-03-26 14:20 Louiszj 阅读(191) 评论(0) 推荐(0) 编辑

[转]HTTP请求行、请求头、请求体详解

摘要: https://blog.csdn.net/u010256388/article/details/68491509 阅读全文

posted @ 2018-03-26 14:01 Louiszj 阅读(630) 评论(0) 推荐(0) 编辑

[转]Google Chrome/IE/FireFox查看HTTP请求头request header响应头

摘要: chrome查看网页header,鼠标右键打开审查元素,或快捷键Shift+Ctrl+I或者shift+ctrl+c当我打开Network后,发现里面是空的什么也没有。查了下,才知,需要刷新页面才能显示出来。 想了想也是应该,只有重新载入网页,chrome才能捕获header信息。 据说这个功能很好 阅读全文

posted @ 2018-03-26 13:41 Louiszj 阅读(3459) 评论(0) 推荐(0) 编辑

2018年3月23日

python requests模块

摘要: 安装 Requests 在你已经安装好python的前提下: 如果你没有安装 pip (啧啧),这个 Python installation guide 可以带你完成这一流程。 获得源码 Requests 一直在 Github 上积极地开发,你可以一直从这里获取到代码。 你可以克隆公共版本库: 发送 阅读全文

posted @ 2018-03-23 16:44 Louiszj 阅读(294) 评论(0) 推荐(0) 编辑

导航