python笔记

【数据的维度】：

从一个数据到一组数据：一个数据表达一个含义，一组数据表达一个或多个含义

一组数据的组织形式：

一维数据：由对等关系的有序或无序数据构成，采用线性方式组织。

　　一组数据的有序结构：列表，数组

　　区别：列表：数据类型可以不同

　　数组：数据类型相同

　　一组数据的无序结构：集合

二维数据：由多个一维数据构成，是一维数据的组合形式。

　　表格：是典型的二维数据，其中，表头是二维数据的一部分

多维数据：由一维或二维数据在新维度上扩展形成

高维数据：仅利用最基本的二元关系展示数据间的复杂结构

数据维度的Python表示：

　　一维数据：列表或集合类型

　　二维数据：列表类型

　　多维数据：列表类型

　　高维数据：字典类型或数据表示格式（JSON、XML、YAML格式）

【Numpy】

Numpy是一个开源的Python科学计算基础库，包含：

　　一个强大的N维数组对象 ndarray

　　广播功能函数

　　整合C/C++/Fortran代码的工具

　　线性代数、傅里叶变换、随机数生成等功能

　　Numpy是Scipy、Pandas等数据处理或科学计算库的基础

# Python已有列表类型，为什么需要一个数组类型？

　　数据对象可以去掉元素间运算所需的循环，使一维向量更像单个数据

　　设置专门的数组对象，经过优化，可以提升这类应用的运算速度

　　观察：科学计算中，一个维度所有数据的类型往往相同

　　数组对象采用相同的数据类型，有助于节省运算和存储空间

N维数组对象：ndarray

ndarray是一个多维数组对象，由两部分构成：

实际的数据

描述这些数据的元数据（数据维度、数据类型等）

ndarray数组一般要求所有元素类型相同，数组下标从0开始

轴(axis)：保存数据的维度；秩(rank)：轴的数量

.ndim 秩，即轴的数量或维度的数量

ndarray对象的属性

　　.shape ndarray对象的尺度，对于矩阵，n行m列

　　.size ndarray对象元素的个数，相当于.shape中n*m的值

　　.dtype ndarray对象的元素类型

　　.itemsize ndarray对象中每个元素的大小，以字节为单位

ndarray数组的元素类型

　　bool 布尔类型，True或False

　　intc 与C语音中的int类型一致，一般是int32或int64

　　intp 用于索引的整数，与C语言中ssize_t一致，int32或int64

　　int8 字节长度的整数，取值[-128, 127]

　　int16 16位长度的整数，取值[-32768, 32767]

　　int32 32位长度的整数，取值[-2³¹, 2³¹-1]

　　int64 64位长度的整数，取值[-2⁶⁴, 2⁶⁴-1]

　　uint8 8位无符号整数，取值[0, 255]

　　uint16 16位无符号整数，取值[0, 65535]

　　uint32 32位无符号整数，取值[0, 2³²-1]

　　uint64 64位无符号整数，取值[0, 2⁶⁴-1]

　　float16 16位半精度浮点数：（符号）尾数*10^指数，1位符号位，5位指数，10位尾数

　　float32 32位半精度浮点数：（符号）尾数*10^指数，1位符号位，8位指数，23位尾数

　　float64 64位半精度浮点数：（符号）尾数*10^指数，1位符号位，11位指数，52位尾数

　　complex64 复数类型，实部和虚部都是32位浮点数

　　complex128 复数类型，实部和虚部都是64位浮点数

# ndarray为什么要支持这么多种元素类型？

　　对比：Python语法仅支持整数、浮点数和复数3种类型

　　科学计算涉及数据较多，对存储和性能都有较高要求

　　对元素类型精细定义，有助于Numpy合理使用存储空间并优化性能

　　对元素类型精细定义，有助于程序员对程序规模有合理评估

ndarray数组的创建方法

　　从Python中的列表、元组等类型创建ndarray数组

　　　　x = np.array(list/tuple)

　　　　x = np.array(list/tuple, dtype=np.float32) 当np.array()不指定dtype时，NumPy将根据数据情况关联一个dtype类型

　　使用NumPy中函数创建ndarray数组，如:arange, ones, zeros等

　　　　np.arange(n) 类似range()函数，返回ndarray类型，元素从0到n-1

　　　　np.ones(shape) 根据shape生成一个全1数组，shape是元组类型

　　　　np.zeros(shape) 根据shape生成一个全0数组，shape是元组类型

　　　　np.full(shape,val) 根据shape生成一个数组，每个元素值都是val

　　　　np.eye(n) 创建一个正方的n*n单位矩阵，对角线为1，其余为0

　　　　np.ones_like(a) 根据数组a的形状生成一个全1数组

　　　　np.zeros_like(a) 根据数组a的形状生成一个全0数组

　　　　np.full_like(a,val) 根据数组a的形状生成一个数组，每个元素值都是val

　　　　np.linspace() 根据起止数据等间距地填充数据，形成数组

　　　　np.concatenate() 将两个或多个数组合并成一个新的数组

　　从字节流(raw bytes)中创建ndarray数组

　　从文件中读取特定格式，创建ndarray数组

ndarray数组的变换：对于创建后的ndarray数组，可以对其进行维度变换和元素类型变换

ndarray数组的维度变换

　　.reshape(shape) 不改变数组元素，返回一个shape形状的数组，原数组不变

　　.resize(shape) 与.reshape()功能一致，但修改原数组

　　.swapaxes(ax1,ax2) 将数组n个维度中两个维度进行调换

　　.flatten() 对数组进行降维，返回折叠后的一维数组，原数组不变

ndarray数组的类型变换

　　new_a = a.astype(new_type) astype()方法一定会创建新的数组(原始数据的一个拷贝)，即使两个类型一致

　　ls = a.tolist()

ndarray数组的操作

数组的索引和切片

　　索引：获取数组中特定位置元素的过程

　　切片：获取数组元素子集的过程

　　一维数组的索引和切片:与Python的列表类似，起始编号：终止编号(不含)：步长，3元素冒号分割，编号0开始从左递增，或-1开始从右递减

　　多维数组的索引：每个维度一个索引值，逗号分割

　　多维数组的切片：选取一个维度用：，每个维度切片方法与一维数组相同，每个维度可以使用步长跳跃切片

ndarray数组的运算

数组与标量之间的运算：数组与标量之间的运算作用于数组的每一个元素

NumPy一元函数：

　　np.rint(x) 计算数组各元素的四舍五入值

　　np.modf(x) 将数组各元素的小数和整数部分以两个独立数组形式返回

　　np.cos(x) np.cosh(x) np.sin(x) np.sinh(x) np.tan(x) np.tanh(x) 计算数组各元素的普通型和双曲型三角函数

　　np.exp(x) 计算数组各元素的指数值

　　np.sign(x) 计算数组各元素的符号值，1(+), 0, -1(-)

NumPy二元函数：

+ - * / ** 两个数组各元素进行对应运算

np.maximum(x,y) np.fmax() np.minimum() np.fmin() 元素级的最大值/最小值计算

np.mod(x,y) 元素级的模运算

np.copysign(x,y) 将数组y中各元素值的符号赋值给数组x对应元素

> < >= <= == != 算术比较，产生布尔型数组

posted @ 2022-09-27 15:11 chliyiyu 阅读(62) 评论(0) 收藏举报

刷新页面返回顶部

python笔记

公告