01 2019 档案

摘要:# 绘制直方图 # 假设你获取了250部电影的时长(列表a中),希望统计出这些电影时长的分布状态(比如时长为100分钟到 # 120分钟电影的数量,出现的频率)等信息,你应该如何呈现这些数据? from matplotlib import pyplot as plt a = [131,98,125,131,124,139,131,117,128,108,135,138,131,102,10... 阅读全文
posted @ 2019-01-21 23:11 桃妖妖 阅读(373) 评论(0) 推荐(0)
摘要:# 绘制多数据条形图 # 假设你知道了列表a中电影分别在2017-09-14(b_14),2017-09-15(b_15), # 2017-09-16(b_16)三天的票房,为了展示列表中电影本身的票房以及同其他电影的数据对比情况,应该如何更加直观的呈现该数据? from matplotlib import pyplot as plt # 让plt能够显示中文 plt.rcParams["... 阅读全文
posted @ 2019-01-21 23:09 桃妖妖 阅读(211) 评论(0) 推荐(0)
摘要:# 绘制电影票房竖条形图 from matplotlib import pyplot as plt a = ["战狼2","速度与激情8","功夫瑜伽","西游伏妖篇","变形金刚5:最后的骑士","摔跤吧!爸爸", "加勒比海盗5:死无对证","金刚:骷髅岛","极限特工:终极回归","生化危机6:终章","乘风破浪", "神偷奶爸3","智取威 阅读全文
posted @ 2019-01-21 23:08 桃妖妖 阅读(192) 评论(0) 推荐(0)
摘要:# 绘制自己和朋友在各个年龄的女友数量的折线图 from matplotlib import pyplot as plt # 让matplotlib能够显示中文 plt.rcParams['font.sans-serif'] = ['SimHei'] x = range(11,31) a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1] b = [1,0... 阅读全文
posted @ 2019-01-20 23:12 桃妖妖 阅读(124) 评论(0) 推荐(0)
摘要:# 绘制3月每天最高温和10月每天最高温散点图 from matplotlib import pyplot as plt # 让matplotlib能够显示中文 plt.rcParams['font.sans-serif'] = ['SimHei'] y_3 = [11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15... 阅读全文
posted @ 2019-01-20 23:12 桃妖妖 阅读(134) 评论(0) 推荐(0)
摘要:# 绘制10点到12点的每一分钟气温变化折线图 import random from matplotlib import pyplot as plt # 让matplotlib能够显示中文 plt.rcParams['font.sans-serif'] = ['SimHei'] x = range(0,120) # 列表推导式理解,随机数从10到30之间取随机整数赋值给变量i,变量i从0到... 阅读全文
posted @ 2019-01-20 23:11 桃妖妖 阅读(139) 评论(0) 推荐(0)
摘要:from matplotlib import pyplot as plt # 先实例一个图片,传入图片参数,10宽,5高,分辨率为80 image = plt.figure(figsize=(10,5),dpi=80) x = range(2,26,2) y = [15,56.4,59,63,5,47,5,8,2,45,4,3] # 绘图 plt.plot(x,y) # 保存图片到本地,... 阅读全文
posted @ 2019-01-20 23:10 桃妖妖 阅读(111) 评论(0) 推荐(0)
摘要:# 使用selenium和phantomJS浏览器登陆豆瓣的小演示 # 导入库 from selenium import webdriver # 实例化一个浏览器对象 web = webdriver.PhantomJS() # 请求页面 web.get("https://www.douban.com/") # 保存截图 web.save_screenshot("douban.png") ... 阅读全文
posted @ 2019-01-20 19:44 桃妖妖 阅读(415) 评论(0) 推荐(0)
摘要:写在前面的声明: 作为一个正在自学爬虫的小白,用爬虫爬了八千本书的云盘链接,然后就想把这写链接的资源都转存到自己的云盘里,以防某一天资源失效。本来想在网上找个能够批量保存的软件,哪知道找到几个都不能用,用手动保存肯定是不现实的。随后想到才学的selenium能够模拟浏览器的操作,就像自己写段自动保存 阅读全文
posted @ 2019-01-20 16:48 桃妖妖 阅读(477) 评论(0) 推荐(0)
摘要:1,首先下载合适的tesseract-ocr的版本 2,然后安装到这一步注意要勾选这一项来安装OCR识别支持的语言包,这样OCR就可以识别多国语言,然后就可以一直点击下一步完成安装。 3,安装tesserocr库,如果在pycharm里面的设置选项里直接安装出错,可以使用whl安装,点击这里下载合适 阅读全文
posted @ 2019-01-16 20:51 桃妖妖 阅读(5493) 评论(1) 推荐(1)
摘要:# 使用selenium和phantomJS浏览器获取网页内容的小演示 # 导入包 from selenium import webdriver # 使用selenium库里的webdriver方法调用PhantomJS浏览器实例一个浏览器的操作对象 # 括号里的参数为PhantomJS浏览器在电脑里的绝对路径,这里已经添加了环境变量,所以可以省略 web = webdriver.Phan... 阅读全文
posted @ 2019-01-14 22:01 桃妖妖 阅读(455) 评论(0) 推荐(0)
摘要:# 本练习是模拟登陆及验证码处理(把验证码下载到本地后手动输入) # 1 通过分析页面获得form表单的登陆接口为 action="https://www.douban.com/accounts/login" # 2 通过抓包发现登陆除了发送账户密码和验证码外,还发送了另一个值: # form_email: 账户 # form_password: 密码 # captcha-solution: ... 阅读全文
posted @ 2019-01-13 23:48 桃妖妖 阅读(665) 评论(0) 推荐(0)
摘要:import requests # 这个练习对比的是上一个登陆练习,这个是不用自己传入cookie参数,而是利用session方法登陆 # 实例化一个session session = requests.session() # 使用session发送post请求,获取对方保存在本地的cookie # 这个url是检查登陆页面的form表单里的action找到的登陆接口 post_url =... 阅读全文
posted @ 2019-01-13 21:42 桃妖妖 阅读(936) 评论(0) 推荐(0)
摘要:1 import requests 2 3 # 这个练习演示的是通过传入cookie信息模拟登陆,这样操作的前提是需要预先在浏览器登陆账户抓包得到cookie字段信息 4 5 url = "http://www.360wa.com/" 6 headers1 = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) Ap... 阅读全文
posted @ 2019-01-13 20:43 桃妖妖 阅读(361) 评论(0) 推荐(0)
摘要:# -*- coding: utf-8 -*- import scrapy from Avv.items import AvvItem class AvSpider(scrapy.Spider): name = 'av' # 爬虫名 allowed_domains = ['51porn.net/'] 阅读全文
posted @ 2019-01-06 16:38 桃妖妖 阅读(4740) 评论(0) 推荐(0)
摘要:这个代码爬百度,淘宝,网易等网站都是正常的,唯有这个网站错误,网上查了好多,有说添加verify=False,有说"Connection": "close",都没有用,求大神帮解决一下 python3.7 阅读全文
posted @ 2019-01-06 15:34 桃妖妖 阅读(3038) 评论(0) 推荐(0)
摘要:import csv class MyProjectPipeline(object): # 保存为csv格式 def __init__(self): # 打开文件,指定方式为写,利用第3个参数把csv写数据时产生的空行消除 self.f = open("myproject.csv","a",newline="") # 设置文件第一行的字段名,注意要跟spider传过来的... 阅读全文
posted @ 2019-01-06 14:40 桃妖妖 阅读(2751) 评论(6) 推荐(0)