Pandas教程-Pandas DataFrame.aggregate()
DataFrame.aggregate() 函数的主要任务是对一个或多个列应用一些聚合。最常用的聚合包括:
sum: 用于返回请求轴上的值的总和。
min: 用于返回请求轴上的最小值。
max: 用于返回请求轴上的最大值。
语法:
DataFrame.aggregate(func, axis=0, *args, **kwargs)
参数:
func: 它是可调用对象、字符串、字典或字符串/可调用对象的列表。
用于聚合数据。对于一个函数,它必须在传递给 DataFrame 或 DataFrame.apply() 时工作。对于 DataFrame,如果键是列名,它可以传递一个字典。
axis: (默认为 0): 它可以是 0 或 'index',1 或 'columns'
0 或 'index': 对于每一列应用一个函数。
1 或 'columns': 对于每一行应用一个函数。
*args: 这是一个位置参数,要传递给 func。
kwargs: 这是一个关键字参数,要传递给 func**。
返回值:
它返回标量、Series 或 DataFrame。
标量: 当调用 Series.agg 时使用单个函数时。
Series: 当为单个函数调用 DataFrame.agg 时使用。
DataFrame: 当为多个函数调用 DataFrame.agg 时使用。
示例:
import pandas as pd
import numpy as np
info=pd.DataFrame([[1,5,7],[10,12,15],[18,21,24],[np.nan,np.nan,np.nan]],columns=['X','Y','Z'])
info.agg(['sum','min'])
输出:
X Y Z
sum 29.0 38.0 46.0
min 1.0 5.0 7.0
示例2:
import pandas as pd
import numpy as np
info=pd.DataFrame([[1,5,7],[10,12,15],[18,21,24],[np.nan,np.nan,np.nan]],columns=['X','Y','Z'])
df.agg({'A' : ['sum', 'min'], 'B' : ['min', 'max']})
输出:
X Y
max NaN 21.0
min 1.0 12.0
sum 29.0 NaN