Pandas的使用

下载

pip install pandas

pandas数据读取

数据类型			说明							pandas读取方法
csv、tev、txt		用逗号分隔、tab分隔的纯文字文件	pd.read_csv
excel			微软xls或者xlsx文件			pd.read_excel
mysql			关系型数据库					pd.read_sql

导入

import pandas as pd 

1、读取纯文本文件

1.1读取csv,使用默认的标题hang,逗号分隔

fpath="文件路径.csv"
#使用pd.read_csv读取数据
#使用read_csv读取数据
ratings=pd.read_csv(fpath,encoding='ANSI')
#查看前几行数据默认5行
print(ratings.head())
#纯文本
pvuv=pd.read_csv(
    fpath,#地址
    sep=r"\t",#分隔符
    header=None,
    names=['name','age']#可以自己定义标题行
)

2.读取excel文件

下载

pip install xlrd
#读取excel文件
fpath=r"文件地址"
xls=pd.read_excel(fpath)
print(xls)

3.读取mysql

#读取MySQL
import pymysql
conn=pymysql.connect(
    host='127.0.0.1',
    user='root',
    password='****',
    charset='utf8',
    database='db1'
)
mysql_qw=pd.read_sql('select * from app01_book',con=conn)
print(mysql_qw)

pandas数据结构

1714126188100

DataFrame:二维数据,这个表格,多行多列

Series:一维数据,一行一列

创建一个一维数据

#创建一个一维数组
sl=pd.Series([1,'a',4.3,2])
#左侧为索引,右侧为数据
print(sl)
#获取索引
print(sl.index)
#获取数据
print(sl.values)

#定义一维数据的索引列
s2=pd.Series([1,'a',4.3,2],index=['a','d','f','e'])
print(s2)
print(s2.index)
#使用字典创建SEries
data={'ojsd':322,'TER':3214,'pid':333,'asd':'上单'}
s3=pd.Series(data)
print(s3)


#取值
print(s3['asd'])#上单
print(s3[['pid','asd']])
#pid    333
# asd     上单
# dtype: object

1714288791993

DataFrame

data={
    'state':['q','w','e','r'],
    'year':[222,333,444,555],
    'pop':[1.2,2.2,2.1,33]
}
datas=pd.DataFrame(data)
print(datas)
#类型
print(datas.dtypes)
#行的索引,列的索引
print(datas.columns)
print(datas.index)
#查询一列,类型
print(datas['year'],datas.dtypes)
print(datas[['year','pop']],datas.dtypes)

查询一行,类型为Series

print(datas.loc[1])
print(type(datas.loc[1]))#Series

查询多行

#查询多行
print(datas.loc[0:2])
print(type(datas.loc[0:2]))#<class 'pandas.core.frame.DataFrame'>