pandas分类统计

一、背景:在工作中总会用到各种统计工作,并且这个工作会反复的做,那么,可不可以让这些重复的工作自动化呢?

     基于这个想法,把工作中常做的重复的工作给自动化一下

二、目标:实现分类统计,即统计相同项目的数量,如下表

       

  统计的结果应该是:经济管理学院 1

           电气信息工程学院  2

           机械科学与工程学院 1

三、使用工具软件:python3.7  

  1、准备数据(g:/test.xlsx)

    

 

       2、实现

       

1 # -*- coding:utf-8 -*-
2 
3 import pandas as pd
4 import numpy as np
5 
6 df = pd.read_excel('G:/test.xlsx')
7 pt1 = pd.pivot_table(df,index=["学院"], aggfunc='count',margins_name='合计',margins='True')
8 #pt1 = df.groupby('学院')['学院'].agg('count')
9 print(pt1)
View Code

  (1)pt1 = pd.pivot_table(df,index=["学院"], aggfunc='count',margins_name='合计',margins='True') 的结果

      

 

  (2)pt1 = df.groupby('学院')['学院'].agg('count')的结果

      

 

   问题来了:

  为什么(1)(2)的结果有差别呢?

  如果让(1)结果跟(2)一样,不需要后面的两个字段呢?

  目前还没有找到解决办法,希望知道的人在后面回复一下,我也学习学习!

 

 

  

 

posted @ 2022-01-21 10:48  ssqhan  阅读(634)  评论(0编辑  收藏  举报