在使用 Pandas 的 DataFrame 时,你可能需要找到列中存在的唯一元素。为此,我们必须使用 unique() 方法从列中提取唯一值。Python 中的 Pandas 库可以轻松帮助我们找到唯一数据。

列中存在的唯一值按其出现的顺序返回。这不会对其出现的顺序进行排序。此外,此方法基于哈希表

它比 numpy.unique() 方法快得多,并且还包括空值。

语法:

pandas.unique(values)  

参数:

values: 它指的是包含数组值的一维类数组对象。

返回值:

此方法返回一个 numpy.ndarray 或 ExtensionArray 对象,可以是:

  • index: 当用户传递索引作为输入时返回。
  • Categorical: 当用户传递 Categorical dtype 作为输入时返回。
  • ndarray: 当用户传递 ndarray/Series 作为输入时返回。

示例 1:

import pandas as pd  
pd.unique(pd.Series([2, 1, 3, 3]))  
pd.unique(pd.Series([pd.Timestamp('20160101'),  
pd.Timestamp('20160101')]))  

输出:

array(['2016-01-01T00:00:00.000000000'], dtype='datetime64[ns]')

示例 2: 下面的示例提取了 Index 中的唯一时间戳:

import pandas as pd  
import numpy as np  
pd.unique(pd.Index([pd.Timestamp('20160101', tz='US/Eastern'),  
pd.Timestamp('20160101', tz='US/Eastern')]))  

输出:

DatetimeIndex(['2016-01-01 00:00:00-05:00'], dtype='datetime64[ns, US/Eastern]', freq=None)

标签: Pandas, Pandas教程, Pandas库, Pandas基础, Pandas学习, Pandas使用, Pandas指南, Pandas入门教程, Pandas模块, Pandas数据库, Pandas实战教程, Pandas用法总结, Pandas文档