python 利用numpy进行数据分析

一、numpy.loadtxt读取数据

data=numpy.loadtxt('数据路径.txt',delimiter=',',usecols=(0,1,2,3) , dtype=float)#读取后是多元数组格式

然后利用数组的特征获取不同列 value=data[:,0:3],classfiy=data[:,4]

参数usecols:选取数据的列。

这里主要说一下usecols的用法。如果iris.txt中的前4列,则usecols=(0,1,2,3)。如果取第5列这一列,则usecols=(4,)。这种取单一列的情况容易出问题,请大家多注意。

 

二、每个数组都有一个shape(表示各维度大小的元组)和一个dtype(一个用于说明数组数据类型的对象)

arr.shape

arr.dtype

arr.ndim:第一维度

三、内建函数

1、生成一定范围内的一维数组数据,arange(n),arange(m,n,x):生成m到n之间的按照x间隔的若干点一维数组

2、生成一定范围内的M*N的二维数组,arange(x).reshape(m*n)

3、np.random中的randn函数:生成一些正态分布的随机数据,np.random.rand(m,n):生成m*n的二维数组

 

posted @ 2016-09-14 16:14  水晶球  阅读(1226)  评论(0编辑  收藏  举报