python 数据清洗- Numpy 和 Pands 练习题01

因为源文件已经被删除了,所以只有运行代码了,通过代码思考吧

import numpy as np
import pandas as pd
#引入csv文件
euro12 = pd.read_csv(r'F:\下载\Euro2012.csv',encoding="utf8")
euro12 =pd.DataFrame(euro12)
print(euro12.head())
#索引Goals列
print(euro12.Goals)
#统计有多少球队参加比赛。nunique():统计某列有那些不同列
print(euro12.Team.nunique())
#统计表中有多少列。shape[0|1]:0表示行,1表示列
print(euro12.shape[1])
#提取表中某些列构成新的DataFrame
discipline = euro12[['Team','Yellow Cards','Red Cards']]
print(discipline.head())
#按照某列排序
print(discipline.sort_values(['Red Cards','Yellow Cards']))
#计算某列的平均值
print(euro12['Yellow Cards'].mean())
#插入进球数大于6的数据,再查询
euro12['Goals6']=euro12['Goals']>6
print(euro12.head(7))
#选取以字母G开头的球队名
print(euro12.Team.str.contains('G').head())
#输出1-6列的数据
print(euro12.iloc[:,:7])
#输出除最后三行的数据
print(euro12.iloc[:,:-3])
#找到三只球队的进球率
a = euro12[3:4][['Team','Shooting Accuracy']]
b = euro12[7:8][['Team','Shooting Accuracy']]
c = euro12[12:13][['Team','Shooting Accuracy']]
print(a,'\n',b,'\n',c)
posted @ 2021-10-27 09:11  你是我的生命之源  阅读(139)  评论(0)    收藏  举报
页脚