第三方模块由全球python爱好者,程序员,各行各业的专家进行开发并进行 维护。
安装第三方模块的语法:
pip install 模块名称
卸载第三方模块的语法:
pip uninstall 模块名称
升级pip命令的语句结构:
python -m pip install --upgrade pip
requests模块
被称为requests库,是用于处理HTTP(Hypertext Transfer Protocol超文本传输协议)请求的第三方库,该库在爬虫程序中应用非常广泛。
使用requests库中的get()函数可以打开一个网络请求,并获取一个Response响应对象,响应结果中的字符串数据可以通过响应对象的text属性获取,响应结果中除了有字符串数据也有二进制数据,响应结果中的二进制数据可以通过响应对象的content属性获取。
import requests import re url='http://www.weather.com.cn/' resp=requests.get(url) # 打开浏览器,打开网址 # 设置编码格式utf-8 resp.encoding='utf-8' print(resp.text) #pattern='src=".*"' pattern=('<span>([\u4e00-\u9fa5]+)</span>') lst=re.findall(pattern,resp.text) print(lst)
openpyxl
openpyxl模块是用于处理excel文件的第三方库,可以对excel文件中的数据进行写入和读取。
| 函数/属性名称 | 功能描述 |
| load_workbook(filename) | 打开已存在的表格,结果为工作薄对象 |
| workbook.sheetnames | 工作薄对象的sheetnames属性,用于获取所有表的名称,结果为列表类型 |
| sheet.append(lst) | 向工作表中添加一行数据,新数据接在工作表已有数据的后面 |
| workbook.save(excelname) | 保存工作薄 |
| Workbook() | 创建新的工作薄对象 |
import openpyxl # 创建工作薄 workbook=openpyxl.Workbook() # 创建sheet sheet=workbook.create_sheet('天气预报') lst=[ ['城市','天气','温度'], ['上海','阴天','10'], ['苏州','晴天','9'], ['武汉','下雪','-2'], ['北京','下雨','-5'] ] for item in lst: sheet.append(item) # sheet里面存放数据 workbook.save('全国天气情况.xlsx')
import openpyxl #获取工作薄 workbook=openpyxl.load_workbook('全国天气情况.xlsx') # 获取所有的列表名 sheets=workbook.sheetnames print(sheets) lst=[] for item in sheets: sheet=workbook[item] if sheet is not None: # 读取行 for row in sheet.rows: sublst=[] # 读取单元格 for cell in row: sublst.append(cell.value) # 将单元格数据存放在子列表 lst.append(sublst) #将行数据放在列表 print(lst)
pdfplumber
可用于从PDF文件中读取内容。
import pdfplumber #打开pdf with pdfplumber.open('test.pdf') as pdf: for i in pdf.pages: print(i.extract_text()) print(f'--------------{i.page_number}-----------------------')
Numpy
是Python数据分析方向和其他库的依赖库,用于处理数组,矩阵等数据。
import numpy as np import numpy as py import matplotlib.pyplot as plt # 读取图片 n1=plt.imread('google.png') print(type(n1),n1) # <class 'numpy.ndarray'> 数组 三维数据,最高维度表示的是图像的高,次高维度表示的图像的款,最低是[R,G,B]颜色 plt.imshow(n1) n2=np.array([0.1999,0.2444,0.1009]) # 创建数据 x=np.dot(n1,n2) plt.imshow(x,cmap='gray') plt.show()
Pandas
是基于Numpy模块扩展的一个非常重要的数据分析模块,使用Pandas读取Excel数据更加的方便。
Matplotlib
是用于数据可视化的模块,使用Matplotlib.pyplot可以非常方便的绘制饼图、柱形图、折线图等。
import pandas as pd import matplotlib.pyplot as plt df=pd.read_excel('全国天气情况.xlsx') print(df) # 解决中文乱码 plt.rcParams['font.sans-serif']=['SimHei'] plt.figure(figsize=(10,6)) city=df['城市'] weather=df['天气'] temperature=df['温度'] print(type(city)) print(city) print(weather) print(temperature) plt.pie(temperature,labels=city,autopct='%1.1f%%',startangle=90) # 设置x,y plt.axis('equal') plt.title('全国天气') plt.show()
PyEcharts
PyEcharts是由百度开源的数据可视化库,它对流行图的支持度比较高,它给用户提供了30多种图形,如柱形渐变图、k线周期图等。
PyEcharts的使用可以分四个步骤实现:
1,导入pyecharts包
2,找到相应图形模板
3,准备相应数据
4,对图表进行个性化修饰
from pyecharts import options as opts from pyecharts.charts import Pie from pyecharts.faker import Faker c = ( Pie() .add("", [list(z) for z in zip(Faker.choose(), Faker.values())]) .set_global_opts(title_opts=opts.TitleOpts(title="Pie-基本示例")) .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}")) .render("pie_base.html") )
PIL
是用于图像处理的第三方库,它支持图像存储、处理和显示等操作。
安装:pip install pillow
from PIL import Image im=Image.open('google.png') print(type(im),im) r,g,b=im.split() print(r) print(g) print(b) om=Image.merge(mode='RGB',bands=(r,b,g)) om.save('new_google.png')
jieba
jieba是python中用于对中文进行分词的模块,它可以将一段中文文本分隔成中文词组的序列。
import jieba with open('test.txt','r',encoding='utf-8') as file: s=file.read() print(s) #分词 lst=jieba.lcut(s) print(lst)
PyInstaller
可以在Windows操作系统中将Python源文件打包成.exe的可执行文件。还可以在Linux和Mac OS操作系统中对源文件进行打包操作。
打包的语法结构:
pyinstaller -F 源文件文件名
注意事项:
在进行文件打包时,需要打包的文件尽量不要有中文,而且需要打包的文件路径也尽量不要有中文,路径中包含中文有可能导致打包失败。
posted on
浙公网安备 33010602011771号