python之pandas学习

一、基本数据格式

import pandas as pd
import numpy as np
import string
#pandas常用数据类型包括:series(一维,带标签数组)和DataFrame(二维,Series容器)
#创建series
t = pd.Series(np.arange(10),index = list(string.ascii_uppercase[:10]))
t

二、基本数据处理

#字典推导式创建经典字典
a = {string.ascii_uppercase[i]:i for i in range(10)}
print(a)

#通过字典创建Series
pd.Series(a)

#pandas会自动根据数据类型更改Series中的dtype类型,修改dtype方式与numpy中的方式一致
a = pd.Series(a,index = list(string.ascii_uppercase[5:15]))
print(a)

三、数据切片索引

#pandas之Series切片与索引
#切片,直接输入start end或步长即可
print(t)
print(t[2:10:2]) #start-end-step
print(t[[2,3,6]]) #多个位置取值
print(t[t>4])
#一个的时候直接传入序号或者index,多个的时候传入序号或着index序号
print(t["F"])
print(t[["A","C","F"]])

#对于一个陌生的series类型,我们如何具体指导其他索引值与具体值
print(t.index)#查看所有索引
print(t.values)#查看具体数值
print(type(t.index))
print(type(t.values))
#sereis对象本质由两个数组构成,一个数组构成对象的键(index,索引),一个数组构成对象的值(values)

四、读入数据,DATa Frame设置

#pandas读入外部数据
a = pd.read_csv("C:/Users/32403/Desktop/岭回归.csv")
a


#pandas之DataFrame
t = pd.DataFrame(np.arange(12).reshape(3,4))
print(t)
# DataFrame对象既有行索引,又有列索引
# 行索引,表明不同行,横向索引,叫index,0轴,axis=0
# 列索引,表名不同列,纵向索引,叫columns,1轴,axis=1


#创建行列-索引值
t = pd.DataFrame(np.arange(12).reshape(3,4),index = list(string.ascii_uppercase[:3]),
                columns = list(string.ascii_uppercase[-4:]))
print(t)
print(t.shape)
print(t.dtypes)
print(t.ndim)
print(t.index)
print(t.columns)
print(t.values)
#DataFrame的基础属性
df.shape()# 行数与列数
df.dtypes()#列数据类型
df.ndim()#数据维度
df.index()#行索引
df.volumns()#列索引
df.values()#对象值

#整体查询实例
print(t.head(3))
print(t.tail(3))
print(t.info())
print(t.describe())

 

posted @ 2020-11-02 19:27  上虞牧之  阅读(87)  评论(0)    收藏  举报