import pandas as pd
import numpy as np
catering_sale='D:\大三下\大数据实验课\data\catering_sale.xls'
data=pd.read_excel(catering_sale,names=['data','sale'])
bins=[0,500,1000,1500,2000,2500,3000,3500,4000]
labels=['[0,500)','[5000,1000)','[1000,1500)','[1500,2000)','[2000,2500)','[2500,3000)','[3000,3500)','[3500,4000)']
#做标签的工作
data['sale分层']=pd.cut(data.sale,bins,labels=labels)
print(data)
![]()
#groupby做统计的工作,实现数据的分组和运算
aggResult=data.groupby(by=['sale分层'])['sale'].agg([('sale', np.size)])
print(aggResult)
![]()
pAggResult=round(aggResult/aggResult.sum(),2)*100
print(pAggResult)
import matplotlib.pyplot as plt
plt.figure(figsize=(10,6))
plt.title("3127")
pAggResult['sale'].plot(kind='bar',width=0.8,fontsize=10,color='r')
plt.rcParams['font.sans-serif']=['SimHei']
plt.title("频率分布直方图(3127)")
plt.show()
![]()
#绘制饼图import pandas as pd
import matplotlib.pyplot as plt
catering_sale='D:\大三下\大数据实验课\data\catering_dish_profit.xls'
data=pd.read_excel(catering_sale)#读取数据
#绘制饼图
x=data['盈利']
labels=data['菜品名']
plt.figure(figsize=(8,6))#设置画布大小
plt.pie(x,labels=labels)#绘制饼图
plt.rcParams['font.sans-serif']='SimHei'
plt.title('销售量分布(饼图)(3127)')#设置标题
plt.show()
![]()
#绘制条形图
x=data['菜品名']
y=data['盈利']
plt.figure(figsize=(8,4))#设置画布大小
plt.bar(x,y)
plt.rcParams['font.sans-serif']='SimHei'
plt.xlabel('类型')#设置x轴坐标
plt.ylabel('销量')#设置y轴坐标
plt.title('销量分布(条形图)(3127)')
plt.show()
![]()
#部门之间
import pandas as pd
import matplotlib.pyplot as plt
data=pd.read_excel("D:\dish_sale.xls")
plt.figure(figsize=(8,4))
plt.plot(data['月份'],data['A部门'],color='green',label='A部门',marker='o')
plt.plot(data['月份'],data['B部门'],color='red',label='B部门',marker='s')
plt.plot(data['月份'],data['C部门'],color='skyblue',label='C部门',marker='x')
plt.legend()
plt.ylabel('销售额(万元)')
plt.title('部门之间销售金额比较3127',fontsize=20)
plt.show()
#B部门
data=pd.read_excel("D:\dish_sale_b.xls")
plt.figure(figsize=(8,4))
plt.plot(data['月份'],data['2012年'],color='green',label='2012年',marker='o')
plt.plot(data['月份'],data['2013年'],color='red',label='2013年',marker='s')
plt.plot(data['月份'],data['2014年'],color='skyblue',label='2014年',marker='x')
plt.legend()
plt.ylabel('销售额(万元)')
plt.title('B部门各年份之间销售金额的比较3127',fontsize=20)
plt.show()
![]()
![]()