在 Pandas 中,DataFrame 有许多有用的数据操作,如下:

行和列的选择

我们可以通过传递行和列的名称来选择 DataFrame 的任何行和列。当你从 DataFrame 中选择时,它变成一维并被视为 Series。

数据过滤

我们可以通过在 DataFrame 中提供一些布尔表达式来过滤数据。

注意:如果我们想将布尔结果传递到 DataFrame 中,它将显示所有结果。

空值

当没有数据提供给项目时,可能会出现空值。各列可能不包含通常表示为 NaN 的值。在 Pandas 中,有几个有用的函数可用于检测、删除和替换 Data Frame 中的空值。这些函数如下:

isnull(): isnull() 的主要任务是在任何行具有空值时返回 true 值。

notnull(): 它是 isnull() 函数的相反,对于非空值返回 true 值。

dropna(): 该方法分析并删除包含空值的行/列。

fillna(): 它允许用户用其他值替换 NaN 值。

replace(): 这是一个非常丰富的函数,可以替换字符串、正则表达式、系列、字典等。

interpolate(): 它是一个非常强大的函数,用于在 DataFrame 或 Series 中填充空值。

字符串操作

在 Pandas 中有一组字符串函数可用于操作字符串数据并忽略缺失/NaN 值。可以使用 .str. 选项执行不同的字符串操作。这些函数如下:

lower(): 将系列或索引中的任何字符串转换为小写字母。

upper(): 将系列或索引中的任何字符串转换为大写字母。

strip(): 该函数帮助去除 Series/index 中每个字符串的空格,包括换行符。

split(' '): 它是一个根据给定模式拆分字符串的函数。

cat(sep=' '): 它用给定的分隔符连接系列/索引元素。

contains(pattern): 如果元素中存在子字符串,则返回 True,否则返回 False。

replace(a, b): 用值 b 替换值 a。

repeat(value): 用指定次数重复每个元素。

count(pattern): 返回每个元素中模式出现的次数。

startswith(pattern): 如果系列中所有元素都以某个模式开头,则返回 True。

endswith(pattern): 如果系列中所有元素都以某个模式结尾,则返回 True。

find(pattern): 用于返回模式的第一次出现。

findall(pattern): 返回模式的所有出现的列表。

swapcase: 用于交换大小写。

islower(): 如果 Series/Index 字符串中的所有字符都是小写,则返回 True。否则,返回 False。

isupper(): 如果 Series/Index 字符串中的所有字符都是大写,则返回 True。否则,返回 False。

isnumeric(): 如果 Series/Index 字符串中的所有字符都是数字,则返回 True。否则,返回 False。

计数值

此操作用于使用 'value_counts()' 选项计算总出现次数。

绘图

Pandas 使用 matplotlib 库绘制图表。.plot() 方法允许您绘制数据的图表。

.plot() 函数绘制索引与每列的图表。

您还可以将参数传递给 plot() 函数以绘制特定列。

标签: Pandas, Pandas教程, Pandas库, Pandas基础, Pandas学习, Pandas使用, Pandas指南, Pandas入门教程, Pandas模块, Pandas数据库, Pandas实战教程, Pandas用法总结, Pandas文档