第三方模块由全球python爱好者,程序员,各行各业的专家进行开发并进行 维护。

安装第三方模块的语法:

pip install 模块名称

卸载第三方模块的语法:

pip uninstall 模块名称

升级pip命令的语句结构:

python -m pip install --upgrade pip

requests模块

被称为requests库,是用于处理HTTP(Hypertext Transfer Protocol超文本传输协议)请求的第三方库,该库在爬虫程序中应用非常广泛。

使用requests库中的get()函数可以打开一个网络请求,并获取一个Response响应对象,响应结果中的字符串数据可以通过响应对象的text属性获取,响应结果中除了有字符串数据也有二进制数据,响应结果中的二进制数据可以通过响应对象的content属性获取。

import requests
import re
url='http://www.weather.com.cn/'
resp=requests.get(url) # 打开浏览器,打开网址
# 设置编码格式utf-8
resp.encoding='utf-8'
print(resp.text)
#pattern='src=".*"'
pattern=('<span>([\u4e00-\u9fa5]+)</span>')
lst=re.findall(pattern,resp.text)
print(lst)

openpyxl

openpyxl模块是用于处理excel文件的第三方库,可以对excel文件中的数据进行写入和读取。

函数/属性名称 功能描述
load_workbook(filename) 打开已存在的表格,结果为工作薄对象
workbook.sheetnames 工作薄对象的sheetnames属性,用于获取所有表的名称,结果为列表类型
sheet.append(lst) 向工作表中添加一行数据,新数据接在工作表已有数据的后面
workbook.save(excelname) 保存工作薄
Workbook() 创建新的工作薄对象

 

 

 

 

 

 

 

import openpyxl
# 创建工作薄
workbook=openpyxl.Workbook()
# 创建sheet
sheet=workbook.create_sheet('天气预报')
lst=[
    ['城市','天气','温度'],
    ['上海','阴天','10'],
    ['苏州','晴天','9'],
    ['武汉','下雪','-2'],
    ['北京','下雨','-5']
]

for item in lst:
    sheet.append(item)  # sheet里面存放数据

workbook.save('全国天气情况.xlsx')
import openpyxl

#获取工作薄
workbook=openpyxl.load_workbook('全国天气情况.xlsx')  
# 获取所有的列表名
sheets=workbook.sheetnames  
print(sheets)
lst=[]
for item in sheets:
    sheet=workbook[item]
    if sheet is not None:
        # 读取行
        for row in sheet.rows:
            sublst=[]
            # 读取单元格
            for cell in row:
                sublst.append(cell.value)  # 将单元格数据存放在子列表
            lst.append(sublst) #将行数据放在列表

print(lst)

pdfplumber

可用于从PDF文件中读取内容。

import pdfplumber

#打开pdf
with pdfplumber.open('test.pdf') as pdf:
    for i in pdf.pages:
        print(i.extract_text())
        print(f'--------------{i.page_number}-----------------------')

Numpy

是Python数据分析方向和其他库的依赖库,用于处理数组,矩阵等数据。

import numpy as np
import numpy as py
import matplotlib.pyplot as plt

# 读取图片
n1=plt.imread('google.png')
print(type(n1),n1) #  <class 'numpy.ndarray'> 数组 三维数据,最高维度表示的是图像的高,次高维度表示的图像的款,最低是[R,G,B]颜色
plt.imshow(n1)

n2=np.array([0.1999,0.2444,0.1009])  # 创建数据
x=np.dot(n1,n2)
plt.imshow(x,cmap='gray')
plt.show()

Pandas

是基于Numpy模块扩展的一个非常重要的数据分析模块,使用Pandas读取Excel数据更加的方便。

Matplotlib

是用于数据可视化的模块,使用Matplotlib.pyplot可以非常方便的绘制饼图、柱形图、折线图等。

import pandas as pd
import matplotlib.pyplot as plt

df=pd.read_excel('全国天气情况.xlsx')
print(df)
# 解决中文乱码
plt.rcParams['font.sans-serif']=['SimHei']
plt.figure(figsize=(10,6))
city=df['城市']
weather=df['天气']
temperature=df['温度']
print(type(city))
print(city)
print(weather)
print(temperature)

plt.pie(temperature,labels=city,autopct='%1.1f%%',startangle=90)

# 设置x,y
plt.axis('equal')
plt.title('全国天气')
plt.show()

PyEcharts

PyEcharts是由百度开源的数据可视化库,它对流行图的支持度比较高,它给用户提供了30多种图形,如柱形渐变图、k线周期图等。

PyEcharts的使用可以分四个步骤实现:

1,导入pyecharts包

2,找到相应图形模板

3,准备相应数据

4,对图表进行个性化修饰

from pyecharts import options as opts
from pyecharts.charts import Pie
from pyecharts.faker import Faker

c = (
    Pie()
    .add("", [list(z) for z in zip(Faker.choose(), Faker.values())])
    .set_global_opts(title_opts=opts.TitleOpts(title="Pie-基本示例"))
    .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}"))
    .render("pie_base.html")
)

PIL

是用于图像处理的第三方库,它支持图像存储、处理和显示等操作。

安装:pip install pillow

from PIL import Image
im=Image.open('google.png')
print(type(im),im)
r,g,b=im.split()
print(r)
print(g)
print(b)
om=Image.merge(mode='RGB',bands=(r,b,g))
om.save('new_google.png')

jieba

jieba是python中用于对中文进行分词的模块,它可以将一段中文文本分隔成中文词组的序列。

import jieba
with open('test.txt','r',encoding='utf-8') as file:
    s=file.read()
print(s)
#分词
lst=jieba.lcut(s)
print(lst)

PyInstaller

可以在Windows操作系统中将Python源文件打包成.exe的可执行文件。还可以在Linux和Mac OS操作系统中对源文件进行打包操作。

打包的语法结构:

pyinstaller -F 源文件文件名

注意事项:

在进行文件打包时,需要打包的文件尽量不要有中文,而且需要打包的文件路径也尽量不要有中文,路径中包含中文有可能导致打包失败。

 

 posted on 2023-12-24 18:45  会飞的金鱼  阅读(63)  评论(0)    收藏  举报