吴裕雄--天生自然python学习笔记:python爬虫PM2.5 实时监测显示器
摘要:PM2.5 对人体的健康影响很大,所以空气中的 PM2.5 实时信息受到越来越多的关注。 Python 的 Pandas 套件不但可以自动读取网页中的表格 数据 , 还可对数据进行修改、排序等处理,也可绘制统计 图表,对于信息抓取、整理以及显示是不可多得的好工具。 将开发一个 PM2.5 实时监测显
阅读全文
吴裕雄--天生自然python学习笔记:python用 Bokeh 模块绘制我国 GDP 数据统计图
摘要:现在我们把我国 1990 年到 2017 年的 GDP 数据抓取出 来,井用 Bokeh 绘 出散点统计图 。 由网页爬取所需数据,并用 Bokeh 绘制散点图 。 import requests #导入网页内容抓取包 import matplotlib.pyplot as plt #导入绘图模块,
阅读全文
吴裕雄--天生自然python学习笔记:爬取我国 1990 年到 2017年 GDP 数据并绘图显示
摘要:绘制图形所需的数据源通常是不固定的,比如,有时我们会需要从网页抓取, 也可能需从文件或数据库中获取。 利用抓取网页数据技术,把我国 1990 年到 2016 年的 GDP 数据抓取出来 ,再利用 MatplotUb 进行绘图显示 。 经搜索发现, http://value500.com/M2GDP.
阅读全文
吴裕雄--天生自然PYTHON学习笔记:解决ElementNotInteractableException: Message: element not interactable
摘要:submit=self.wait.until(EC.element_to_be_clickable((By.ID,'loginAction'))) 2.永久覆盖element来保证自己的element。方法是如下的代码: WebElement ele = driver.findElement(By.
阅读全文
吴裕雄--天生自然PYTHON学习笔记:python自动登录网站
摘要:打开 www. 5 l eta . com 网站,如果己经通过某用户名进行了登录,那么先退出登录 。 登录该网站 的步骤一般如下 : ( 1 )单击右上角的“登录”按钮。 ( 2 )先输入账号。 ( 3 )再输入密码 , 然后单击“登录 ” 按钮。 现在 , 我们要改用 Python 程序,自动完成
阅读全文
吴裕雄--天生自然python学习笔记:解决WebDriverException: Message: unknown error: missing or invalid 'entry.level'
摘要:会出现这个错误是因为你的chrome浏览器与下载的chromedriver.exe版本不一致造成的。 到这个地址:https://npm.taobao.org/mirrors/chromedriver/79.0.3945.36/下载下图所示的驱动,要注意看自己操作系统来下载 如果是windows系统
阅读全文
吴裕雄--天生自然python学习笔记:python用 Selenium 组件实现浏览器操作自动化
摘要:一般情况下,我们都是用手工操作的方式来对浏览器进行各种操作 。 实际上, 只要我们安装一个自动化操作组件, Python 就可以让我们的很多操作实现自动化 。 Selenium 组件 在开发网页时,用户接口的测试向来是一件相当不容易的事情,如果用手动方 式进行测试的各种操作,不仅效率低而且容易出错
阅读全文
吴裕雄--天生自然python学习笔记:python通过“任务计划程序”实现定时自动下载或更新运行 PM2.5 数据抓取程序数据
摘要:在 Windows 任务计划程序中,设置每隔 30 分钟自动抓取 PM2.5 数据,井保存 在 SQLite 数据库中 。 import sqlite3,ast,requests,os from bs4 import BeautifulSoup #cur_path=os.path.dirname(_
阅读全文
吴裕雄--天生自然python学习笔记:编写网络爬虫代码获取指定网站的图片
摘要:我们经常会在网上搜索井下载图片,然而一张一张地下载就太麻烦了,本案例 就是通过网络爬虫技术, 一次性下载该网站所有的图片并保存 。 网站图片下载并保存 将指定网站的 .jpg 和 .png 格式的图片全部下载井保存在自己本地新建的 images 文件夹中 。 import requests,os from bs4 import BeautifulSoup from ur...
阅读全文
吴裕雄--天生自然python学习笔记:编写网络爬虫代码获取北京市PM2.5 实时数据
摘要:掌握了前面所讲的正则表达式、网页解析以及 BeautifulSoup 抓取基本内容后,就可以编写网络爬虫代码获取数据了。 从 http://www.pm25x.com/ 网站抓取北京的 PM2.5 实时数据 。 抓取北京市 PM2.5 实时数据 现在我们的目的很明确,就是取回北京市 PM2.5 当时的实时数值。 因为这个结果会实时改变,所以你们实际取得的数值会和此时我在案例中抓取到的数据有所不同,
阅读全文
吴裕雄--天生自然python学习笔记:网页解析
摘要:抓取万水书苑网页中所有<a>标签中的超链接井显示。 import requests from bs4 import BeautifulSoup url = 'http://www.wsbookshow.com/' html = requests.get(url) html.encoding="gbk" sp=BeautifulSoup(html.text,"html.parser") links=
阅读全文
吴裕雄--天生自然python学习笔记:python爬虫与网页分析
摘要:我们所抓取的网页源代码一般都是 HTML 格式的文件,只要研究明白 HTML 中 的标签( Tag )结构,就很容易进行解析并取得所需数据 。 HTML 网页结构 HTML 网 页是由许多标签( Tag )构成,标签需用 。字符括起来 。 大部分标签 成对出现,与开始标签对应的结束标签前多 一个“/ ” 字符,例如 < html><斤itml>。 少 数标签非成对出现 ,如 <i mg src=’
阅读全文
吴裕雄--天生自然python学习笔记:案例:用正则表达式查找邮件账号
摘要:抓取万水书苑“ ht甲://www.w sbookshow.com/ ”网站中的所有 E-mai l 账号。 import requests,re regex = re.compile('[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+') url = 'http://www.wsbookshow.com/' html = requests.ge...
阅读全文
吴裕雄--天生自然python学习笔记:WEB数据抓取与分析
摘要:常见的正则表达式功能介绍 直接调用 re.match ()方法 上例若用 match 方法搜索 ,得到的结果将会是 None 。
阅读全文
吴裕雄--天生自然 python语言数据分析:开普勒系外行星搜索结果分析
摘要:import pandas as pd pd.DataFrame({'Yes': [50, 21], 'No': [131, 2]}) pd.DataFrame({'Bob': ['I liked it.', 'It was awful.'], 'Sue': ['Pretty good.', 'Bland.']}) pd.DataFrame({'Bob': ['I like...
阅读全文
吴裕雄--天生自然 R语言数据分析:火箭发射的地点、日期/时间和结果分析
摘要:dfS = read.csv("F:\\kaggleDataSet\\spacex-missions\\database.csv") library(dplyr) library(tidyr) library(data.table) library(sqldf) library(highcharter) library(ggrepel) library(leaflet) library(v...
阅读全文
吴裕雄--天生自然 PYTHON数据分析:钦奈水资源管理分析
摘要:df = pd.read_csv("F:\\kaggleDataSet\\chennai-water\\chennai_reservoir_levels.csv") df["Date"] = pd.to_datetime(df["Date"], format='%d-%m-%Y') df.head() import datetime def scatter_plot(cnt_srs, ...
阅读全文
吴裕雄--天生自然 PYTHON数据分析:医疗数据分析
摘要:import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv) # plotly import chart_studio.plotly as py from plotly.offline import init_notebook_mode, i...
阅读全文
吴裕雄--天生自然 PYTHON数据分析:人类发展报告——HDI, GDI,健康,全球人口数据数据分析
摘要:import pandas as pd # Data analysis import numpy as np #Data analysis import seaborn as sns # Data visualization import matplotlib.pyplot as plt # Data Visualization import matplotlib.gridspec as...
阅读全文
吴裕雄--天生自然 python数据分析:医疗费数据分析
摘要:import numpy as np import pandas as pd import os import matplotlib.pyplot as pl import seaborn as sns import warnings warnings.filterwarnings('ignore') data = pd.read_csv('F:\\kaggleDataSet\\Medic...
阅读全文