python之pandas学习
一、基本数据格式
import pandas as pd import numpy as np import string #pandas常用数据类型包括:series(一维,带标签数组)和DataFrame(二维,Series容器) #创建series t = pd.Series(np.arange(10),index = list(string.ascii_uppercase[:10])) t
二、基本数据处理
#字典推导式创建经典字典 a = {string.ascii_uppercase[i]:i for i in range(10)} print(a) #通过字典创建Series pd.Series(a) #pandas会自动根据数据类型更改Series中的dtype类型,修改dtype方式与numpy中的方式一致 a = pd.Series(a,index = list(string.ascii_uppercase[5:15])) print(a)
三、数据切片索引
#pandas之Series切片与索引 #切片,直接输入start end或步长即可 print(t) print(t[2:10:2]) #start-end-step print(t[[2,3,6]]) #多个位置取值 print(t[t>4]) #一个的时候直接传入序号或者index,多个的时候传入序号或着index序号 print(t["F"]) print(t[["A","C","F"]]) #对于一个陌生的series类型,我们如何具体指导其他索引值与具体值 print(t.index)#查看所有索引 print(t.values)#查看具体数值 print(type(t.index)) print(type(t.values)) #sereis对象本质由两个数组构成,一个数组构成对象的键(index,索引),一个数组构成对象的值(values)
四、读入数据,DATa Frame设置
#pandas读入外部数据 a = pd.read_csv("C:/Users/32403/Desktop/岭回归.csv") a #pandas之DataFrame t = pd.DataFrame(np.arange(12).reshape(3,4)) print(t) # DataFrame对象既有行索引,又有列索引 # 行索引,表明不同行,横向索引,叫index,0轴,axis=0 # 列索引,表名不同列,纵向索引,叫columns,1轴,axis=1 #创建行列-索引值 t = pd.DataFrame(np.arange(12).reshape(3,4),index = list(string.ascii_uppercase[:3]), columns = list(string.ascii_uppercase[-4:])) print(t) print(t.shape) print(t.dtypes) print(t.ndim) print(t.index) print(t.columns) print(t.values) #DataFrame的基础属性 df.shape()# 行数与列数 df.dtypes()#列数据类型 df.ndim()#数据维度 df.index()#行索引 df.volumns()#列索引 df.values()#对象值 #整体查询实例 print(t.head(3)) print(t.tail(3)) print(t.info()) print(t.describe())

浙公网安备 33010602011771号