240
我爱毛绒绒~~~~~~~

可视化分析 - Matplotlib模块

简介

Pyplot 是 Matplotlib 的子库,提供了和 MATLAB 类似的绘图 API。

Pyplot 是常用的绘图模块,能很方便让用户绘制 2D 图表。

Pyplot 包含一系列绘图函数的相关函数,每个函数会对当前的图像进行一些修改,例如:给图像加上标记,生新的图像,在图像中产生新的绘图区域等等。

pyplot子模块的绘图流程

在学习使用pyplot子模块绘图时,需要先了解使用该模块实现绘图的业务流程,根据绘图流程调用pyplot子模块中对应的方法即可实现绘制大多数常用的图表。

安装

pip install matplotlib

使用的时候,我们可以使用 import 导入 matplotlib.pyplot 库,并设置一个别名 plt

初始化使用

plt.figure():创建新画布(也可以直接使用默认的)

plt.pyplot.title():图表标题

matplotlib.rcParams['font.family'] = 'SimHei':设置中文字体

plt.xlable():x轴标签

plt.ylable():y轴标签

plt.show():展示图表

常见图表方法

线图或者散点图:plt.plot([x], y, [fmt], *, data=None, *\*kwargs)(或plot([x], y, [fmt], [x2], y2, [fmt2], ..., **kwargs)直接画多条)

  • x, y:点或线的节点,x 为 x 轴数据,y 为 y 轴数据,数据可以列表或数组。

  • fmt:可选,定义基本格式(如颜色、标记和线条样式)。

  • kwargs:可选,用在二维平面图上,设置指定属性,如标签,线的宽度等。

    • 颜色字符:'b' 蓝色,'m' 洋红色,'g' 绿色,'y' 黄色,'r' 红色,'k' 黑色,'w' 白色,'c' 青绿色,'#008000' RGB 颜色符串。多条曲线不指定颜色时,会自动选择不同颜色。

    • 线型参数:'‐' 实线,'‐‐' 破折线,'‐.' 点划线,':' 虚线。

    • 标记字符:'.' 点标记,',' 像素标记(极小点),'o' 实心圈标记,'v' 倒三角标记,'^' 上三角标记,'>' 右三角标记,'<' 左三角标记...等等。

我们也可以绘制任意数量的点,只需确保两个轴上的点数相同即可。

如果我们 x 轴上的点,则 y 轴会根据 x 轴的值来设置为 0, 1, 2, 3..N-1

散点图:plt.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, *, edgecolors=None, plotnonfinite=False, data=None, *\*kwargs)

  • x,y:长度相同的数组,也就是我们即将绘制散点图的数据点,输入数据。

  • s:点的大小,默认 20,也可以是个数组,数组每个参数为对应点的大小。

  • c:点的颜色,默认蓝色 'b',也可以是个 RGB 或 RGBA 二维行数组。

  • marker:点的样式,默认小圆圈 'o'。

  • cmap:Colormap,颜色条就像一个颜色列表,其中每种颜色都有一个范围从 0 到 100 的值,默认值为 'viridis'。(不用记有啥颜色条,写一个错的,报错全都出来了)

  • norm:Normalize,默认 None,数据亮度在 0-1 之间,只有 c 是一个浮点数的数组的时才使用。

  • vmin,vmax::亮度设置,在 norm 参数存在时会忽略。

  • alpha:透明度设置,0-1 之间,默认 None,即不透明。

  • linewidths::标记点的长度。

  • edgecolors::颜色或颜色序列,默认为 'face',可选值有 'face', 'none', None。

  • plotnonfinite::布尔值,设置是否使用非限定的 c ( inf, -inf 或 nan) 绘制点。

柱形图:plt.bar(x, height, width=0.8, bottom=None, *, align='center', data=None, *\*kwargs)

没有参数y(y即height)

  • x:浮点型数组,柱形图的 x 轴数据。

  • height:浮点型数组,柱形图的高度。(垂直柱形图)

  • width:浮点型数组,柱形图的宽度。

  • bottom:浮点型数组,底座的 y 坐标,默认 0。

  • align:柱形图与 x 坐标的对齐方式,'center' 以 x 位置为中心,这是默认值。 'edge':将柱形图的左边缘与 x 位置对齐。要对齐右边缘的条形,可以传递负数的宽度值及 align='edge'。

直方图:plt.hist(x, bins=None, range=None, density=False, weights=None, cumulative=False, bottom=None, histtype='bar', align='mid', orientation='vertical', rwidth=None, log=False, color=None, label=None, stacked=False, *\*kwargs)

直方图x轴:表示数据的分组区间(箱或者bin)这些区间将整个数据范围划分为连续的等宽的间隔,每个区间包含的数据点数量决定了该区间对应的柱子高度
直方图y轴:表示落入每个区间的数据点频数或者频率

  • x:表示要绘制直方图的数据,可以是一个一维数组或列表。

  • bins:可选参数,表示直方图的箱数。默认为10。

  • range:可选参数,表示直方图的值域范围,可以是一个二元组或列表。默认为None,即使用数据中的最小值和最大值。

  • density:可选参数,表示是否将直方图归一化。默认为False,即直方图的高度为每个箱子内的样本数,而不是频率或概率密度。

  • weights:可选参数,表示每个数据点的权重。默认为None。

  • cumulative:可选参数,表示是否绘制累积分布图。默认为False。

  • bottom:可选参数,表示直方图的起始高度。默认为None。

  • histtype:可选参数,表示直方图的类型,可以是'bar'、'barstacked'、'step'、'stepfilled'等。默认为'bar'。

  • align:可选参数,表示直方图箱子的对齐方式,可以是'left'、'mid'、'right'。默认为'mid'。

  • orientation:可选参数,表示直方图的方向,可以是'vertical'、'horizontal'。默认为'vertical'。

  • rwidth:可选参数,表示每个箱子的宽度。默认为None。

  • log:可选参数,表示是否在y轴上使用对数刻度。默认为False。

饼图:plt.pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistance=0.6, shadow=False, labeldistance=1.1, startangle=0, radius=1, counterclock=True, wedgeprops=None, textprops=None, center=0, 0, frame=False, rotatelabels=False, *, normalize=None, data=None)

  • x:浮点型数组或列表,用于绘制饼图的数据,表示每个扇形的面积

  • explode:数组,表示各个扇形之间的间隔,默认值为0

  • autopct:设置饼图内各个扇形百分比显示格式,%d%% 整数百分比,%0.1f 一位小数, %0.1f%% 一位小数百分比, %0.2f%% 两位小数百分比。

  • shadow::布尔值 True 或 False,设置饼图的阴影,默认为 False,不设置阴影。

  • startangle::用于指定饼图的起始角度,默认为从 x 轴正方向逆时针画起,如设定 =90 则从 y 轴正方向画起。

  • labeldistance:标签标记的绘制位置,相对于半径的比例,默认值为 1.1,如 <1则绘制在饼图内侧。

  • pctdistance::类似于 labeldistance,指定 autopct 的位置刻度,默认值为 0.6。

  • radius::设置饼图的半径,默认为 1。

  • wedgeprops :字典类型,默认值 None。用于指定扇形的属性,比如边框线颜色、边框线宽度等。例如:wedgeprops={'linewidth':5} 设置 wedge 线宽为5。

  • textprops :字典类型,用于指定文本标签的属性,比如字体大小、字体颜色等,默认值为 None。

  • frame :布尔类型,用于指定是否绘制饼图的边框,默认值:False。如果是 True,绘制带有表的轴框架。

多图绘制:plt.subplot(nrows, ncols, index, *\*kwargs) 方法在绘图时需要指定位置

设置 numRows = 1,numCols = 2,就是将图表绘制成 1x2 的图片区域, 对应的坐标为:(1, 1), (1, 2)

import matplotlib.pyplot as plt
import matplotlib
import numpy as np

'''设置中文字体'''
matplotlib.rcParams['font.family'] = 'SimHei'

plt.figure()
'''图表一:条形图'''
plt.subplot(2,2,1)   ###画布切割成2行2列,第一块画条形图
x = [9,12,13,17]
y = [1,9,13,11]
plt.plot(x,y,'r')
plt.title('条形图')
'''图表二:散点图'''
plt.subplot(2,2,2)
x = np.random.rand(50)
y = np.random.rand(50)
size = np.random.rand(50)*250
color = range(50)
plt.scatter(x,y,cmap='Set3',c=color,alpha=0.5)
plt.title('散点图')
'''图表三:柱形图'''
plt.subplot(2,2,3)
x = ['a','b','c','d']
y =[3,9,11,7]
plt.bar(x,y)
plt.title('柱形图')
'''图表四:扇形图'''
plt.subplot(2,2,4)
size =[15,25,10,35]
lables = ['A','B','C','D']
color =['yellowgreen','gold','lightskyblue','lightcoral']
explod = (0,0.1,0,0)
plt.pie(size,colors=color,explode=explod,labels=lables,autopct='%1.1f%%',shadow=True,startangle=90)
plt.title('扇形图')

plt.show()

plt.subplots(nrows=1, ncols=1, *, sharex=False, sharey=False, squeeze=True, subplot_kw=None, gridspec_kw=None, **fig_kw):设置多个可以共享轴的图表

返回两个对象,画布对象和子图对象

  • sharex、sharey:设置 x、y 轴是否共享属性,默认为 false,可设置为 'none'、'all'、'row' 或 'col'。 False 或 none 每个子图的 x 轴或 y 轴都是独立的,True 或 'all':所有子图共享 x 轴或 y 轴,'row' 设置每个子图行共享一个 x 轴或 y 轴,'col':设置每个子图列共享一个 x 轴或 y 轴。

    • 每一列共享X轴

    • 每一行共享Y轴

    • 所有图表共享X,Y

  • squeeze:布尔值,默认为 True,表示额外的维度从返回的 Axes(轴)对象中挤出,对于 N1 或 1N 个子图,返回一个 1 维数组,对于 N*M,N>1 和 M>1 返回一个 2 维数组。如果设置为 False,则不进行挤压操作,返回一个元素为 Axes 实例的2维数组,即使它最终是1x1。

  • subplot_kw:可选,字典类型。把字典的关键字传递给 add_subplot() 来创建每个子图

  • gridspec_kw:可选,字典类型。把字典的关键字传递给 GridSpec 构造函数创建子图放在网格里(grid)。

  • **fig_kw:把详细的关键字参数传给 figure() 函数。

    • 新建画布创建一个绘图

    • 创建两个子图,共享y轴

plt.grid(b=None, which='major', axis='both', )

  • **b:可选,默认为 None,可以设置布尔值,true 为显示网格线,false 为不显示,如果设置 kwargs 参数,则值为 true。

  • which:可选,可选值有 'major'、'minor' 和 'both',默认为 'major',表示应用更改的网格线

  • axis:可选,设置显示哪个方向的网格线,可以是取 'both'(默认),'x' 或 'y',分别表示两个方向,x 轴方向或 y 轴方向。

  • **kwargs:可选,设置网格样式,可以是 color='r', linestyle='-' 和 linewidth=2,分别表示网格线的颜色,样式和宽度。

其他图表方法

plt.imshow(X, cmap=None, norm=None, aspect=None, interpolation=None, alpha=None, vmin=None, vmax=None, origin=None, extent=None, shape=None, filternorm=1, filterrad=4.0, imlim=None, resample=None, url=None, *, data=None, **kwargs)

  • X:输入数据。可以是二维数组、三维数组、PIL图像对象、matplotlib路径对象等。

  • cmap:颜色映射。用于控制图像中不同数值所对应的颜色。可以选择内置的颜色映射,如gray、hot、jet等,也可以自定义颜色映射。

plt.tight_layout(pad=1.08,h_pad=None,w_pad=None,rect=None):调整布局

自动调整子图参数,使子图适应图形区域,避免重叠的标签或标题

  • pad:图形边缘与子图之间的间距
  • h_pad:子图之间的垂直间距
  • w_pad:子图之间的水平间距
  • rect:指定在那个矩形区域内调整布局(左,下,有,上)

plt.subplots_adjust(left=None,bottom=None,right=None,top=None,wspace=None,hspace=None):更加精确的调整图形布局,通常在tight_layout后使用

  • left:图形左侧位置(0-1)
  • bottom:图形底部位置(0-1)
  • right:图形右侧位置(0-1)
  • top:图形顶部位置(0-1)
  • wspace:子图间水平间距(宽度比例)
  • hspace:子图间垂直间距(高度比例)

plt.savefig(fname, dpi='figure', format=None,bbox_inches='tight',pad_inches=0.1,facecolor='auto',edgecolor='auto',transparent=False,metadata=None),相对较慢

  • fname:保存图像的文件名,可以是相对路径或绝对路径。
  • dpi='figure':分辨率(每英寸点数)
  • format=None:文件格式(自动从扩展名推断)
  • bbox_inches='tight':边界框控制
  • pad_inches=0.1:边界填充
  • facecolor='auto':图形背景色
  • edgecolor='auto':图形边框色
  • transparent=False:是否透明
  • metadata=None:元数据(如版权信息)
    关键特性
    • 保存完整图形(Figure):包括所有可视化组件(坐标轴,标题,图例等)
    • 支持矢量格式:PDF、SVG、EPS 等(无损缩放)
    • 高度可定制:可控制分辨率、边界框、透明度等
    • 智能布局处理:自动优化图形输出

plt.imsave(fname, arr, **kwargs)非常高效

  • fname:保存图像的文件名,可以是相对路径或绝对路径。
  • arr:表示图像的NumPy数组。
  • kwargs:可选参数,用于指定保存的图像格式以及图像质量等参数。
    关键特性
    • 保存原始像素数据(NumPy 数组):仅保存数组表示的图像
    • 仅支持位图格式:PNG、JPG、BMP 等(不支持矢量格式)
    • 简单直接:无额外图形元素
    • 高效处理:适合批量保存图像数据
posted @ 2024-04-02 17:10  水开白  阅读(83)  评论(0)    收藏  举报