pandas分类统计

一、背景：在工作中总会用到各种统计工作，并且这个工作会反复的做，那么，可不可以让这些重复的工作自动化呢？

　　　　　基于这个想法，把工作中常做的重复的工作给自动化一下

二、目标：实现分类统计，即统计相同项目的数量，如下表

　　统计的结果应该是：经济管理学院 1

　　　　　　　　　　　电气信息工程学院 2

　　　　　　　　　　　机械科学与工程学院 1

三、使用工具软件：python3.7

　　1、准备数据（g:/test.xlsx)

2、实现

1 # -*- coding:utf-8 -*-
2 
3 import pandas as pd
4 import numpy as np
5 
6 df = pd.read_excel('G:/test.xlsx')
7 pt1 = pd.pivot_table(df,index=["学院"], aggfunc='count',margins_name='合计',margins='True')
8 #pt1 = df.groupby('学院')['学院'].agg('count')
9 print(pt1)

View Code

　　（1）pt1 = pd.pivot_table(df,index=["学院"], aggfunc='count',margins_name='合计',margins='True') 的结果

　　（2）pt1 = df.groupby('学院')['学院'].agg('count')的结果

　　问题来了：

　　为什么（1）（2）的结果有差别呢？

　　如果让（1）结果跟（2）一样，不需要后面的两个字段呢？

　　目前还没有找到解决办法，希望知道的人在后面回复一下，我也学习学习！

posted @ 2022-01-21 10:48 ssqhan 阅读(661) 评论(0) 收藏举报

刷新页面返回顶部

物来顺心,事去宁心!

pandas分类统计

公告