pands与numpy 基本用法
import numpy as np
import pandas as pd
b = np.array([1,2,3])
b.ndim #数组维度数
#等差数列 -
# np.linspace(0,4,num=11)
np.linspace(0,4,num=11)
# np.linspace(0,2) #序列值
np.random.randn(6,4) #6行4列随机数
np.random.randn(3,6,3) #3维的6行4列随机数
np.random.randint(1,5,size=(3,2)) #1到5之间的2维的
np.random.randint(1,100,5) #生成5个从x到x
- #pandas
- #Series 是一维数组,基于numpy的ndarray结构 series
#np.nan 是一个float类型的数据
obj = pd.Series([1,2,3,4,5,np.nan])
obj
# np.sum(obj) #统计obj的值
obj[0] #取obj的第一值(与list相同,根据索引取值)
#直接根据索引号,同时拿到1,3,5
obj[[0,2,4]]
- Series
d={"a":10,"b":20,"c":30}
d=pd.Series(d)
d
a 10 b 20 c 30 dtype: int64
d[0] #它的索引号是不变的 10
d["a"] #它的key变成索引号 10
- #自定义序列号
i=["jinhao","zhaoyun","xixoadong","yangyang"]
# a=pd.Series([1,2,3,np.nan],index=i)
a=pd.Series([1,2,3,np.nan],index=i)
a
a.value_counts(ascending=True)#排序-小-大
#np.dtype() 定义一个数组类型
#自定义index 索引值
obj3=pd.Series(["张三","上海",22],index=["姓名","地区","年龄"])
obj3
姓名 张三 地区 上海 年龄 22 dtype: object
- # DataFrame是2维数组

浙公网安备 33010602011771号