pandas
5.1序列与数据框的构造
pandas模块的核心操作对象就是序列(Series)和数据框(DataFrame)。
5.1.1构造序列
实现方法:
①通过同质的列表或元组构建。
②通过字典构建。
③通过numpy中的一维数组构建
④通过数据框DataFrame中的某一列构建。
import numpy as np
import pandas as pd
ser1=pd.Series(("郑阿奇","齐大伟","小甲鱼","董付国"))
print(ser1)
ser2=pd.Series([82,67,75,84])
print(ser2)
arr=np.array([1001,1002,1003,1004])
ser3=pd.Series(arr)
print(ser3)
输出结果如下:

import pandas as pd
ser1=pd.Series([82,67,75,84],index=("郑阿奇","齐大伟","小甲鱼","董付国"))
print(ser1)
print(ser1["小甲鱼"])
print(ser1[2])
输出结果如下:

import pandas as pd
ser=pd.Series([82,67,75,84],index=(1,2,3,4))
print(ser)
print(ser[1])
print(ser[3])
输出结果如下:

5.1.2构造数据框
数据框本质上是带行索引(index)和列索引(columns)的二维数组(values)。
构造方法:
①通过嵌套的列表或元组构成。
②通过字典构造。
③通过二维数组构造。
④通过外部数据构造。
import numpy as np
import pandas as pd
lst=[["郑阿奇","男",82],["齐大伟","女",67],["小甲鱼","男",75],["董付国","女",84]]
df1=pd.DataFrame(lst)
print(df1)
ser=np.array(lst)
df2=pd.DataFrame(ser)
print(df2)
输出结果如下:

5.2外部数据的读取
import pandas as pd
df=pd.read_table("dataFile/score.txt", sep=',',header=0,index_col=0,usecols=["学号","姓名","Python"])
print(df)
print(type(df))
print(df.shape)
输出结果如下:

import pandas as pd
df=pd.read_excel("dataFile/score.xlsx",engine="openpyxl")
print(df)
print(type(df))
输出结果如下:

5.3
5.4
5.5
5.6
5.7

浙公网安备 33010602011771号