Pandas教程-Pandas Series.value_counts()
value_counts() 函数返回一个包含唯一值计数的系列。它返回的对象将按降序排列,以便其第一个元素将是出现频率最高的元素。
默认情况下,它排除 NA 值。
语法
Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)
参数
- normalize: 如果为真,则返回的对象将包含唯一值的相对频率。
- sort: 按值排序。
- ascending: 按升序排序。
- bins: 而不是计数值,它将它们分组到半开放的箱中,为 pd.cut 提供便利,这仅适用于数值数据。
- dropna: 不包括 NaN 的计数。
返回值
它返回计数的系列。
示例1
import pandas as pd
import numpy as np
index = pd.Index([2, 1, 1, np.nan, 3])
index.value_counts()
输出
1.0 2
3.0 1
2.0 1
dtype: int64
示例2
import pandas as pd
import numpy as np
index = pd.Index([2, 1, 1, np.nan, 3])
a = pd.Series([2, 1, 1, np.nan, 3])
a.value_counts(normalize=True)
输出
1.0 0.50
3.0 0.25
2.0 0.25
dtype: float64
示例3
import pandas as pd
index = pd.Index([1, 3, 2, 2, 1, np.nan])
index.value_counts()
a = pd.Series([1, 3, 2, 2, 1, np.nan])
a.value_counts(bins=2)
输出
(0.997, 2.0] 4
(2.0, 3.0] 1
dtype: int64
示例4
import pandas as pd
index = pd.Index([1, 3, 2, 2, 1, np.nan])
index.value_counts()
a = pd.Series([1, 3, 2, 2, 1, np.nan])
a.value_counts(dropna=False)
输出
2.0 2
1.0 2
NaN 1
3.0 1
dtype: int64