笨鸟教程 - 程序员AI编程教程

Pandas教程-Pandas DataFrame.aggregate()

作者: 汤圆
时间: 2024-02-22
分类: Pandas教程
评论

DataFrame.aggregate() 函数的主要任务是对一个或多个列应用一些聚合。最常用的聚合包括：sum: 用于返回请求轴上的值的总和。min: 用于返回请求轴上的最小值。max: 用于返回请求轴上的最大值。

Pandas教程-Pandas DataFrame.apply()

作者: 汤圆
时间: 2024-02-22
分类: Pandas教程
评论

Pandas apply() 函数允许用户传递一个函数，并将其应用于 Pandas series 的每个单个值。这个函数改进了 panda 库的功能，因为它有助于根据所需的条件对数据进行分离。因此，它可以有效地用于数据科学和机器学习。要传递给函数的对象是Series 对象，其索引要么是 DataFrame 的索引，即 axis=0，要么是 DataFrame 的列，即 axis=1。默认情况下，result_type=None，最终的返回类型是从应用的函数的返回类型推断出的。否则，它取决于 result_type 参数。

- 阅读剩余部分 -

Pandas教程-Pandas DataFrame.append()

作者: 汤圆
时间: 2024-02-22
分类: Pandas教程
评论

Pandas append() 函数用于将其他 dataframe 的行添加到给定 dataframe 的末尾，返回一个新的 dataframe 对象。新列和新单元格被插入到原始 DataFrame 中，这些单元格填充了 NaN 值。

- 阅读剩余部分 -

Pandas教程-Python Pandas DataFrame

作者: 汤圆
时间: 2024-02-22
分类: Pandas教程
评论

Pandas DataFrame（数据框）是一种广泛使用的数据结构，它与带有标签轴（行和列）的二维数组一起工作。DataFrame 被定义为存储具有两个不同索引的数据的标准方式，即行索引和列索引。它具有以下属性：列可以是异构类型，如整数、布尔值等。它可以被看作是一种 Series 结构的字典，其中行和列都被索引。在列的情况下，它表示为“columns”，在行的情况下表示为“index”。

- 阅读剩余部分 -

Pandas教程-Pandas Series.value_counts()

作者: 汤圆
时间: 2024-02-21
分类: Pandas教程
评论

value_counts() 函数返回一个包含唯一值计数的系列。它返回的对象将按降序排列，以便其第一个元素将是出现频率最高的元素。默认情况下，它排除 NA 值。

- 阅读剩余部分 -

Pandas教程-Pandas Series.unique()

作者: 汤圆
时间: 2024-02-21
分类: Pandas教程
评论

在使用 Pandas 的 DataFrame 时，你可能需要找到列中存在的唯一元素。为此，我们必须使用 unique() 方法从列中提取唯一值。Python 中的 Pandas 库可以轻松帮助我们找到唯一数据。列中存在的唯一值按其出现的顺序返回。这不会对其出现的顺序进行排序。此外，此方法基于哈希表。它比 numpy.unique() 方法快得多，并且还包括空值。

- 阅读剩余部分 -

Pandas教程-Pandas Series.to_frame()

作者: 汤圆
时间: 2024-02-21
分类: Pandas教程
评论

系列被定义为一种可以容纳整数、字符串、双精度值等的列表类型。它返回一个对象形式的列表，该列表的索引从 0 到 n，其中 n 表示系列中值的长度。系列和数据帧之间的主要区别在于，系列只能包含一个具有特定索引的列表，而数据帧是由多个系列组合而成的，可以分析数据。

- 阅读剩余部分 -

Pandas教程-Pandas Series.std()

作者: 汤圆
时间: 2024-02-21
分类: Pandas教程
评论

Pandas std() 函数用于计算给定一组数字、DataFrame、列和行的标准偏差。在计算标准偏差时，我们需要导入名为 "statistics" 的包进行中位数的计算。默认情况下，标准偏差通过 N-1 标准化，可以通过 ddof 参数进行更改。

- 阅读剩余部分 -

Pandas教程-Pandas Series.map()

作者: 汤圆
时间: 2024-02-21
分类: Pandas教程
评论

Pandas Series.map() 的主要任务是用于映射两个具有共同列的系列的值。要映射两个系列，第一个系列的最后一列应与第二个系列的索引列相同，并且值应该是唯一的。

- 阅读剩余部分 -

Pandas教程-Python Pandas Series

作者: 汤圆
时间: 2024-02-21
分类: Pandas教程
评论

Pandas Series可以定义为能够存储各种数据类型的一维数组。我们可以轻松地将列表、元组和字典转换为使用“series”方法的系列。系列的行标签称为索引。一个系列不能包含多个列。它有以下参数：data: 它可以是任何列表、字典或标量值。index: 索引的值应该是唯一且可哈希的。它必须与数据的长度相同。如果我们不传递任何索引，默认的 np.arrange(n) 将被使用。dtype: 它指的是系列的数据类型。copy: 它用于复制数据。

- 阅读剩余部分 -

Pandas教程-Pandas DataFrame.aggregate()

Pandas教程-Pandas DataFrame.apply()

Pandas教程-Pandas DataFrame.append()

Pandas教程-Python Pandas DataFrame

Pandas教程-Pandas Series.value_counts()

Pandas教程-Pandas Series.unique()

Pandas教程-Pandas Series.to_frame()

Pandas教程-Pandas Series.std()

Pandas教程-Pandas Series.map()

Pandas教程-Python Pandas Series

推荐文章

其它