利用Python进行数据分析10.2

10.2 数据聚合 Data Aggregation

grouped_pct.agg(["mean", "std", peak_to_peak])

自定义生成的DataFrame的列名：
```
grouped_pct.agg([("AVE", "mean"), ("STD", np.std)])
```
如果你传递的是（name，founction）元组的列表，那么每个元组第一个元素将作为DataFrame的列名。

计算tip_pct和total_bill列的三个相同的统计值：

function=['count','mean','max']
result=grouped['tip_pct','total_bill'].agg(functions)
result

传递具有自定义名称的元组列表：

ftuples = [("Average", "mean"), ("Variance", np.var)]
grouped[["tip_pct", "total_bill"]].agg(ftuples)

使用字典形式传递函数，从而将不同的函数应用到一个或是多个列上：
```
agrouped.agg({'tip':'np.max','size':'sum'})
```
在tip列计算每个小组的最大值；在size列统计总数。
使用字典形式在不同的列应用不同的函数：
```
grouped.agg({'tip_pct':['min','max','mean','std'],'size':'sum'})
```
在tip_pct列计算每个小组的最大值,最小值，均值，方差；在size列统计总数。

在grouby中使用as_index=False来禁用分组键作为索引：

tips.groupby(['day','smoker'],as_index=False).mean()

当然，也可以分完组以后，在使用reset_index()将index恢复到dataframe中：

tips.groupby(['day','smoker']).mean().reset_index()