在前面深入讨论了在Series和DataFrame使用groupby方法,但仍然有一些额外的方法可能会用到。
前面,在分组操作中学习了apply方法用于执行转换操作。还有另一个内建方法transform,与apply方法类似但是会对你可以使用的函数种类加上更多的限制:

这里是按’key’分组的均值:

假设想要产生一个Series,它的尺寸和df[‘value’]一样,但值都被按’key’分组的均值替代。可以向transfrom传递匿名函数lambda x: x.mean():

对于内建的聚合函数,可以像GroupBy的agg方法一样传递一个字符串别名:

可以按照每个组的降序计算排名:

内建的聚合函数如’mean’或’sum’通常会比apply函数更快。这些函数在与transform一起使用时也会存在一个”快速通过”。

对于时间序列数据,resample方法在语义上是一种基于时间分段的分组操作。下面是一个小的示例表:

可以按’time’进行索引,然后重新采样:

假设DataFrame包含多个时间序列,并按一个附加的分组键列进行了标记:
