python numPy模块 与numpy里的数据类型、数据类型对象dtype

学习链接:http://www.runoob.com/numpy/numpy-tutorial.html

官方链接:https://numpy.org/devdocs/user/quickstart.html

简介:

numPy是python语言的一个扩展库,是一个运行非常快的数学库,主要用于数组计算。它支持大量的维度与数据运算还针对数组运算提供大量的数学函数库。它包含:一个强大的n维数组对象ndarray、广播功能函数、整合c/c++/fortran的工具、线性代数、傅里叶变化与随机数生成等功能

numPy应用

  numpy通常与SciPy(Scientific Python)和Matplotlib(绘图库)配合使用,来代替MatLab,构成为强大的科学计算环境,帮助我们通过Python学习数据科学或者机器学习

安装:

$pip install numPy

  测试安装成功:

>>> from numpy import *    #导入numpy库
>>> eye(4)    #生成对角矩阵
array([[1., 0., 0., 0.],
       [0., 1., 0., 0.],
       [0., 0., 1., 0.],
       [0., 0., 0., 1.]])

 

使用

*)numpy.linspace()

  参考链接:https://numpy.org/devdocs/reference/generated/numpy.linspace.html?highlight=linspace#numpy.linspace

  像python中的range一般,返回有指定的间隔产生的均匀间隔的数组,值得注意的是有dtype这个参数

*)numpy. arange()

  参考链接:https://numpy.org/devdocs/reference/generated/numpy.arange.html?highlight=arange#numpy.arange

  值在半开区间里被生成[start,stop),对于int类型的参数,函数等同于python中的range,但是返回一个ndarray而不是list

  但是对于非整形的step参数,每次返回的结果往往不一致,对于这种情况,选择numpy.linspace()更好

*)numpy.zeros()

  参考链接:https://numpy.org/devdocs/reference/generated/numpy.zeros.html?highlight=zeros#numpy.zeros

  返回由0填充的数组,能指定填充的0的dtype

*)numpy.column_stack()

  参考链接:https://numpy.org/devdocs/reference/generated/numpy.ma.column_stack.html?highlight=column_stack#numpy.ma.column_stack

  将一系列的1-D(我认为是1维)arrays堆叠为column以此来将他们转化为一个2维array,二维数组被堆叠为和原来的一样

*)

  

*)list to array

参考链接:https://docs.scipy.org/doc/numpy/reference/generated/numpy.asarray.html

>>> a = [1, 2]
>>> np.asarray(a)
array([1, 2])

  

numpy random模块参考链接:https://www.cnblogs.com/hhh5460/p/4324967.html#top(官方文档翻译)

*)np.random.randint(low[,high,size,dtype])

参考链接:https://www.jianshu.com/p/36a4bbb5536e

>>> np.random.randint(0,20,4)
array([ 1,  9, 17, 11])
>>> np.random.randint(0,20,[4,1])#结果中包含4个数组,每个一个
array([[16],
       [19],
       [ 5],
       [ 9]])
>>> np.random.randint(0,20,[4])
array([ 4,  6, 11, 14])
>>> np.random.randint(0,20,4,1)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "mtrand.pyx", line 973, in mtrand.RandomState.randint
TypeError: data type not understood

  

1)np.random.normal()生成高斯分布的概率密度随机数

参考链接:https://blog.csdn.net/qiqiaiairen/article/details/52505667

这个方法返回一个正态分布的数组?(正态分布、又称高斯分布、钟形曲线)

numpy.random.normal(loc=0.0, scale=1.0, size=None)

  参数含义

  loc:(float类型)概率分布的均值,是对应于整个分布的中心而言

  scale:(float类型)概率分布的标准差(标准差反应集合内个体的离散程度,越大越离散),对应于分布的宽度而言(即高度一定?),scale越大越矮胖,scale越小越瘦高

  size:(int or tuple of ints类型)输出的shape(?),默认为None,只输出一个值

这个方法返回一个正态分布的数组

>>> numpy.random.normal(0,1,20)
array([-0.98305884, -0.79340779,  0.69865242,  1.10930775,  0.17458143,
        0.88452427,  0.92862304, -1.27837941, -0.88772762,  0.86100981,
        3.06262977,  1.66589188, -1.34269035, -0.13672729,  0.01154996,
       -1.88304306,  0.35375017, -0.88784919,  2.77849309,  0.68915905])

  

2)np.range与range

  range是python自带的库

  参考链接:https://blog.csdn.net/lanchunhui/article/details/49493633

  三个参数(S,E,Step_size)第一个参数是起点,第三个是步长,返回一个不包括第二个参数的数据序列

 

numpy里的数据类型、数据类型对象dtype

参考链接:https://www.runoob.com/numpy/numpy-dtype.html

numpy 支持的数据类型比 Python 内置的类型要多很多,基本上可以和 C 语言的数据类型对应上,其中部分类型对应为 Python 内置的类型。详情见参考链接

 

数据类型对象 (dtype)

  dtype是用来描述与数组对应的内存区域如何使用(懵逼,不只有一种使用方法吗?)这依赖如下几个方面:

  • 数据的类型(整数,浮点数或者 Python 对象)
  • 数据的大小(例如, 整数使用多少个字节存储)
  • 数据的字节顺序(小端法或大端法)

字节顺序是通过对数据类型预先设定"<"或">"来决定的。"<"意味着小端法(最小值存储在最小的地址,即低位组放在最前面)。">"意味着大端法(最重要的字节存储在最小的地址,即高位组放在最前面)。

  • 在结构化类型的情况下,字段的名称、每个字段的数据类型和每个字段所取的内存块的部分
  • 如果数据类型是子数组,它的形状和数据类型

 

dtype 对象是使用以下语法构造的:

numpy.dtype(object, align, copy)
  • object - 要转换为的数据类型对象
  • align - 如果为 true,填充字段使其类似 C 的结构体。(继续懵逼)
  • copy - 复制 dtype 对象 ,如果为 false,则是对内置数据类型对象的引用

创建dtype的例子:

  

>>> dt=np.dtype(np.int32)# 使用标量类型#不要忘记前面的np.
>>> print(dt)
int32#直接输出的这个
>>>

  

之后有列举了一些创建dtype的其他实例,介绍了一些特殊的格式如:

int8, int16, int32, int64 四种数据类型可以使用字符串 'i1', 'i2','i4','i8' 代替

特殊的有一个字节顺序标注的

import numpy as np
# 字节顺序标注
dt = np.dtype('<i4')
print(dt)
#结果
int32

 

之后又展示了结构化数据类型的创建

# 类型字段名可以用于存取实际的 age 列
import numpy as np
dt = np.dtype([('age',np.int8)]) 
a = np.array([(10,),(20,),(30,)], dtype = dt) 
print(a['age'])
#结果:
[10 20 30]

 

问题

  因为上面哪个“dtype是用来描述与数组对应的内存区域如何使用”的疑惑还没有解决,而且在后面我也没有看到dtype是怎样使用的,只是输出了int32之类的东西,难道上面哪一个“结构化”是使用,

而且numpy的一些方法如numpy.linspace()又dtype这个参数,我也不知道有什么用。

posted @ 2019-06-22 19:56  凌晨四点的蓝  阅读(3401)  评论(0编辑  收藏  举报