value_counts() 函数返回一个包含唯一值计数的系列。它返回的对象将按降序排列,以便其第一个元素将是出现频率最高的元素。

默认情况下,它排除 NA 值。

语法

Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)  

参数

  • normalize: 如果为真,则返回的对象将包含唯一值的相对频率。
  • sort: 按值排序。
  • ascending: 按升序排序。
  • bins: 而不是计数值,它将它们分组到半开放的箱中,为 pd.cut 提供便利,这仅适用于数值数据。
  • dropna: 不包括 NaN 的计数。

返回值

它返回计数的系列。

示例1

import pandas as pd  
import numpy as np  
index = pd.Index([2, 1, 1, np.nan, 3])  
index.value_counts()  

输出

1.0    2
3.0    1
2.0    1
dtype: int64

示例2

import pandas as pd  
import numpy as np  
index = pd.Index([2, 1, 1, np.nan, 3])  
a = pd.Series([2, 1, 1, np.nan, 3])  
a.value_counts(normalize=True)  

输出

1.0    0.50
3.0    0.25
2.0    0.25
dtype: float64

示例3

import pandas as pd  
index = pd.Index([1, 3, 2, 2, 1, np.nan])  
index.value_counts()  
a = pd.Series([1, 3, 2, 2, 1, np.nan])  
a.value_counts(bins=2)  

输出

(0.997, 2.0]    4
(2.0, 3.0]        1
dtype: int64

示例4

import pandas as pd  
index = pd.Index([1, 3, 2, 2, 1, np.nan])  
index.value_counts()  
a = pd.Series([1, 3, 2, 2, 1, np.nan])  
a.value_counts(dropna=False)  

输出

2.0     2
1.0     2
NaN   1
3.0     1
dtype: int64

标签: Pandas, Pandas教程, Pandas库, Pandas基础, Pandas学习, Pandas使用, Pandas指南, Pandas入门教程, Pandas模块, Pandas数据库, Pandas实战教程, Pandas用法总结, Pandas文档