pandas

5.1序列与数据框的构造

pandas模块的核心操作对象就是序列(Series)和数据框(DataFrame)。

5.1.1构造序列

实现方法:

①通过同质的列表元组构建。

②通过字典构建。

③通过numpy中的一维数组构建

④通过数据框DataFrame中的某一列构建。

import numpy as np
import pandas as pd

ser1=pd.Series(("郑阿奇","齐大伟","小甲鱼","董付国"))
print(ser1)
ser2=pd.Series([82,67,75,84])
print(ser2)
arr=np.array([1001,1002,1003,1004])
ser3=pd.Series(arr)
print(ser3)

输出结果如下:

 

import pandas as pd
ser1=pd.Series([82,67,75,84],index=("郑阿奇","齐大伟","小甲鱼","董付国"))
print(ser1)
print(ser1["小甲鱼"])
print(ser1[2])
输出结果如下:

 

import pandas as pd
ser=pd.Series([82,67,75,84],index=(1,2,3,4))
print(ser)
print(ser[1])
print(ser[3])
输出结果如下:

 

 

 

 

5.1.2构造数据框

数据框本质上是带行索引(index)和列索引(columns)的二维数组(values)。

构造方法:

①通过嵌套的列表元组构成。

②通过字典构造。

③通过二维数组构造。

④通过外部数据构造。

import numpy as np
import pandas as pd
lst=[["郑阿奇","男",82],["齐大伟","女",67],["小甲鱼","男",75],["董付国","女",84]]
df1=pd.DataFrame(lst)
print(df1)
ser=np.array(lst)
df2=pd.DataFrame(ser)
print(df2)

输出结果如下:

5.2外部数据的读取

import pandas as pd
df=pd.read_table("dataFile/score.txt", sep=',',header=0,index_col=0,usecols=["学号","姓名","Python"])
print(df)
print(type(df))
print(df.shape)

输出结果如下:

 

 

import pandas as pd
df=pd.read_excel("dataFile/score.xlsx",engine="openpyxl")
print(df)
print(type(df))

输出结果如下:

 

 

 

5.3

 

5.4

 

5.5

 

5.6

 

5.7

 

posted @ 2021-06-04 16:56  不可哈希  阅读(108)  评论(0)    收藏  举报