python 数据分析-pandas数据结构

python 数据分析-pandas数据结构

pandas是基于Numpy的一种工具,为了结局数据分析任务而创建

pandas 两大数据结构,Series(一维数据),Dataframe(多维特征数据,既有行索引,也有列索引)

pandas Series创建函数 pandas.Series(data,index,dtype,copy)
data:数据可以采用各种形式,如:ndarry,list,constants
index:索引值必须是唯一的散列的与数据长度相同,如果没有,默认np.arange(len(data))
dtype: 用于数据类型,如果没有,将推断数据类型
copy:复制数据,默认为false


import  pandas as pd
import numpy as np
a=pd.Series([11,12].index=["上海"."北京"])
print(a)
b=pd.Series({"a":2,"b":1,"c":5})#通过字典创建
print(b)
b['a]=5#对数据进行修改
print(b)
b.index=['v','c','cd']#可以通过index函数修改索引值

Series中一个很重要的功能是:它会在算术运算中自动对齐不同索引的数据

DataFrame:
DataFrame是一个表格型的数据结构,他含有一组有序的列,每列可以是不同的值类型
DataFrame 构造函数:
pandas.DataFrame(data,index,columns,dtype,copy)
这里就介绍一下data,其他的跟Series很像
data: 数据可以采取各种形式,如:ndarry,series,map,lists,dict, constant或者另一个DataFrame

import pandas as pd
data=[1,4,3,4]
df=pd.DataFrame(data)
print(df)
data=[['ad',5443],['ad',34]]
df=pd.DataFrame(data,columns=['name','age'],dtype=float)
print(df)
data={'a':[12,3,34,3,543,34],'b':[34,4,3,4,345]}
df=pd.DataFrame(data)
print(df)

DataFrame如果指定位置没有数据对应,就会生成Nan填充

posted @ 2020-04-05 17:47  高兴_00  阅读(303)  评论(0编辑  收藏  举报