pands与numpy 基本用法

import numpy as np

import pandas as pd

b = np.array([1,2,3])

b.ndim #数组维度数

#等差数列 -

# np.linspace(0,4,num=11)

np.linspace(0,4,num=11)

# np.linspace(0,2) #序列值

np.random.randn(6,4) #6行4列随机数

np.random.randn(3,6,3) #3维的6行4列随机数

np.random.randint(1,5,size=(3,2)) #1到5之间的2维的

np.random.randint(1,100,5) #生成5个从x到x

  • #pandas
  • #Series 是一维数组,基于numpy的ndarray结构 series

#np.nan 是一个float类型的数据

obj = pd.Series([1,2,3,4,5,np.nan])

obj

# np.sum(obj) #统计obj的值

obj[0] #取obj的第一值(与list相同,根据索引取值)

#直接根据索引号,同时拿到1,3,5
obj[[0,2,4]]

  • Series

 

d={"a":10,"b":20,"c":30}
d=pd.Series(d)
d

a    10
b    20
c    30
dtype: int64

 d[0] #它的索引号是不变的 10

d["a"] #它的key变成索引号 10

  • #自定义序列号

i=["jinhao","zhaoyun","xixoadong","yangyang"]
# a=pd.Series([1,2,3,np.nan],index=i)
a=pd.Series([1,2,3,np.nan],index=i)
a

a.value_counts(ascending=True)#排序-小-大
#np.dtype() 定义一个数组类型

#自定义index 索引值
obj3=pd.Series(["张三","上海",22],index=["姓名","地区","年龄"])
obj3

姓名    张三
地区    上海
年龄    22
dtype: object
  • # DataFrame是2维数组

 

posted @ 2021-04-21 09:09  Mr`Chen  阅读(189)  评论(0)    收藏  举报