python可视化:第十次作业,Pandans进阶

# 1. (其它)
# (1)导入待处理的数据demo.xls,并显示前5行。
import pandas as pd
df=pd.read_excel(r'C:\Users\11059\Desktop\python 可视化作业文件\第十次作业文件\demo.xls')
pff=pd.DataFrame(df)
print('\n(1)导入待处理的数据demo.xls,并显示前5行。')
print(pff.head())


# (2)查看数据的描述信息。
print('\n(2)查看数据的描述信息。')
print(pff.info())


# (3)对size 中的空缺数据用平均值填充。
pff['size'] = pff['size'].fillna(pff['size'].mean())
print('\n(3)对size 中的空缺数据用平均值填充。')
print(pff)

# (4)格式化size数据,使用round函数四舍五入保留小数2位。
pff['size'] = pff['size'].fillna(pff['size'].mean())
print('(4)格式化size数据,使用round函数四舍五入保留小数2位。')
print(pff.round(2))





# 2. (其它) 在DEMO中增加1列:人均消费,并保留小数点后2位。
import pandas as pd
pd.set_option('display.unicode.east_asian_width', True)
pf = pd.read_excel(r'C:\Users\11059\Desktop\python 可视化作业文件\第十次作业文件\demo.xls')
pf['size'] = pf['size'].fillna(pf['size'].mean())
pf['size'] = pf['size'].round(0)
pf['人均消费'] = round(pf['total_bill'] / pf['size'], 2)
print(pf.round(2))





# 3. (其它)
import pandas as pd

pd.set_option('display.unicode.east_asian_width', True)
pf = pd.read_excel(r'C:\Users\11059\Desktop\python 可视化作业文件\第十次作业文件\demo.xls')

# (1)利用分组函数,分析男性顾客和女性顾客谁更慷慨些?
print('\n# (1)利用分组函数,分析男性顾客和女性顾客谁更慷慨些?')
print(pf.groupby('sex')['tip'].mean())

# (2)分析星期和消费的关系。
print('\n# (2)分析星期和消费的关系。')
print(pf.groupby(['day'])['total_bill'].mean())

# (3)分析性别+吸烟的组合因素对慷慨度的影响。
print('\n# (3)分析性别+吸烟的组合因素对慷慨度的影响。')
print(pf.groupby(['sex','smoker'])['tip'].mean())

# (4)分析星期+时间的组合因素对总消费额的影响。
print('\n# (4)分析星期+时间的组合因素对总消费额的影响。')
print(pf.groupby(['day','time'])['total_bill'].mean())

 

posted @ 2021-12-03 22:53  Bruce_Sun  阅读(155)  评论(0)    收藏  举报