分类 Pandas教程下的文章-笨鸟教程

Pandas教程-Pandas 简便手册

作者: 汤圆
时间: 2024-03-04
分类: Pandas教程
评论

Pandas 可以被视为数据科学中最重要的 Python 包。它提供了许多处理数据的函数，使数据分析变得更加简便。其快速、灵活和表达力强大的数据结构旨在进行现实世界的数据分析。Pandas 简便手册是一个快速指南，介绍了你在使用 Python 进行数据处理时需要了解的 Pandas 基础知识。如果你想以 Pandas 开始数据科学之旅，可以将它用作处理数据的便捷参考。

- 阅读剩余部分 -

Pandas提供了.loc[]和.iloc[]方法进行数据切片。数据切片通常指的是检查数据集。这两种方法属于索引选择方法，用于为数据集的每一行设置标识符。索引可以采用特定标签，这些标签可以是整数或用户指定的任何其他值。.loc[]方法用于通过标签或数据框中存在的布尔数组检索行和列的组合。它仅接受索引标签，如果存在于调用数据框中，它将返回行、列或数据框。它是基于标签的方法，但可以与布尔数组一起使用。

- 阅读剩余部分 -

Pandas教程-Pandas DataFrame.loc[]

作者: 汤圆
时间: 2024-03-01
分类: Pandas教程
评论

DataFrame.loc[] 用于通过标签或布尔数组在 DataFrame 中检索行和列的组。它只接受索引标签，如果它存在于调用者 DataFrame 中，它将返回行、列或 DataFrame。DataFrame.loc[] 是基于标签的，但可以与布尔数组一起使用。

- 阅读剩余部分 -

Pandas教程-Pandas DataFrame.isin()

作者: 汤圆
时间: 2024-03-01
分类: Pandas教程
评论

DataFrame.isin() 方法的主要任务是选择具有特定列中特定（或多个）值的行。

- 阅读剩余部分 -

Pandas教程-Pandas DataFrame.iloc[]

作者: 汤圆
时间: 2024-03-01
分类: Pandas教程
评论

DataFrame.iloc[] 用于在 DataFrame 的索引标签不是 0、1、2、....、n 的数字系列或用户不知道索引标签的情况下使用。我们可以使用一个在 DataFrame 中不可见的虚拟索引位置来提取行。它是基于整数的位置（从轴的 0 到长度-1），但也可以与布尔数组一起使用。

- 阅读剩余部分 -

Pandas教程-Pandas DataFrame.replace()

作者: 汤圆
时间: 2024-03-01
分类: Pandas教程
评论

Pandas 的 replace() 是一个非常丰富的函数，用于从 DataFrame 中替换字符串，正则表达式，字典，列表和系列。DataFrame 的值可以动态地替换为其他值。它能够与 Python 正则表达式一起使用。这与使用 .loc 或 .iloc 进行更新不同，后者需要您指定要用某个值进行更新的位置。

- 阅读剩余部分 -

Pandas教程-Pandas DataFrame.fillna()

作者: 汤圆
时间: 2024-03-01
分类: Pandas教程
评论

我们可以使用 fillna() 函数填充数据集中的空值。

- 阅读剩余部分 -

Pandas教程-Pandas DataFrame.dropna()

作者: 汤圆
时间: 2024-03-01
分类: Pandas教程
评论

如果您的数据集包含空值，我们可以使用 dropna() 函数来分析和删除数据集中的行/列。

- 阅读剩余部分 -

Pandas教程-Pandas DataFrame.corr()

作者: 汤圆
时间: 2024-03-01
分类: Pandas教程
评论

DataFrame.corr() 方法的主要任务是找到 DataFrame 中所有列的成对相关性。如果存在任何空值，它将自动排除它们。它还会忽略 DataFrame 中的非数值数据类型列。

- 阅读剩余部分 -

Pandas教程-数据处理

作者: 汤圆
时间: 2024-03-01
分类: Pandas教程
评论

在数据分析和建模的大部分时间中，都花费在数据准备和处理上，即加载、清理和重新排列数据等。此外，由于Python库，Pandas为我们提供了高性能、灵活和高级的数据处理环境。对于 Pandas，有各种功能可用于有效地处理数据。层次化索引为了增强数据处理的能力，我们必须使用一些索引，这有助于根据标签对数据进行排序。因此，层次化索引出现在这里，并被定义为 Pandas 的一个基本特性，可以帮助我们使用多个索引级别。

- 阅读剩余部分 -