Pandas教程-Python Pandas 数据操作

在 Pandas 中，DataFrame 有许多有用的数据操作，如下：

行和列的选择

我们可以通过传递行和列的名称来选择 DataFrame 的任何行和列。当你从 DataFrame 中选择时，它变成一维并被视为 Series。

数据过滤

我们可以通过在 DataFrame 中提供一些布尔表达式来过滤数据。

空值

当没有数据提供给项目时，可能会出现空值。各列可能不包含通常表示为 NaN 的值。在 Pandas 中，有几个有用的函数可用于检测、删除和替换 Data Frame 中的空值。这些函数如下：

isnull()： isnull() 的主要任务是在任何行具有空值时返回 true 值。

notnull()： 它是 isnull() 函数的相反，对于非空值返回 true 值。

dropna()： 该方法分析并删除包含空值的行/列。

fillna()： 它允许用户用其他值替换 NaN 值。

replace()： 这是一个非常丰富的函数，可以替换字符串、正则表达式、系列、字典等。

interpolate()： 它是一个非常强大的函数，用于在 DataFrame 或 Series 中填充空值。

字符串操作

在 Pandas 中有一组字符串函数可用于操作字符串数据并忽略缺失/NaN 值。可以使用 .str. 选项执行不同的字符串操作。这些函数如下：

lower()： 将系列或索引中的任何字符串转换为小写字母。

upper()： 将系列或索引中的任何字符串转换为大写字母。

strip()： 该函数帮助去除 Series/index 中每个字符串的空格，包括换行符。

split(' ')： 它是一个根据给定模式拆分字符串的函数。

cat(sep=' ')： 它用给定的分隔符连接系列/索引元素。

contains(pattern)： 如果元素中存在子字符串，则返回 True，否则返回 False。

replace(a, b)： 用值 b 替换值 a。

repeat(value)： 用指定次数重复每个元素。

count(pattern)： 返回每个元素中模式出现的次数。

startswith(pattern)： 如果系列中所有元素都以某个模式开头，则返回 True。

endswith(pattern)： 如果系列中所有元素都以某个模式结尾，则返回 True。

find(pattern)： 用于返回模式的第一次出现。

findall(pattern)： 返回模式的所有出现的列表。

swapcase： 用于交换大小写。

islower()： 如果 Series/Index 字符串中的所有字符都是小写，则返回 True。否则，返回 False。

isupper()： 如果 Series/Index 字符串中的所有字符都是大写，则返回 True。否则，返回 False。

isnumeric()： 如果 Series/Index 字符串中的所有字符都是数字，则返回 True。否则，返回 False。

计数值

此操作用于使用 'value_counts()' 选项计算总出现次数。

绘图

Pandas 使用 matplotlib 库绘制图表。.plot() 方法允许您绘制数据的图表。

.plot() 函数绘制索引与每列的图表。

您还可以将参数传递给 plot() 函数以绘制特定列。