在本文中,我们将讨论如何使用seaborn库创建countplot,以及如何使用不同的参数从我们的数据集特征中推断结果。

Seaborn库

seaborn库广泛用于数据分析,它包含的众多图形为我们的数据提供了最佳的表示。

可以使用以下方式将seaborn库导入我们的工作环境:

import seaborn as sns  

现在,让我们讨论为什么要使用countplot以及其参数的重要性。

Countplot

Countplot用于表示分类变量中出现的观察次数(计数)。

它使用柱状图的概念进行可视化呈现。

参数

在创建countplot时,我们可以指定以下参数,让我们简要了解它们:

  1. x和y: 此参数指定我们用于表示的数据,然后观察突出显示的模式。
  2. color: 此参数指定可为我们的图形提供良好外观的颜色。
  3. palette: 它采用调色板的值。它主要用于显示色调变量。
  4. hue: 此参数指定列名。
  5. data: 此参数指定我们希望用于表示的数据帧。例如,数据可以是一个数组。
  6. dodge: 此参数是可选的,接受布尔值作为输入。
  7. saturation: 此参数接受浮点数值。当我们指定此参数时,可以观察颜色强度的变化。
  8. hue_order: 参数hue_order接受字符串作为输入。
  9. kwargs: 参数kwargs指定键值映射。
  10. ax: 参数ax是可选的,用于创建图形的轴。
  11. orient: 参数orient是可选的,指定我们需要的图的方向,水平或垂直。

现在让我们看看如何以不同方式表示我们的属性。

在第一个示例中,我们将为单个变量创建一个countplot。我们使用了数据集'tips'来实现相同的功能。

1. 单个变量的值计数

示例:

import matplotlib.pyplot as plt  
import seaborn as sns  
import pandas as pd  
#loading the dataset 'tips'  
df=pd.read_csv("/content/tips.csv")  
#plotting the graph  
sns.countplot(x='sex',data=df)  
plt.show() 

输出:

256-1.png

在下一个示例中,我们将使用hue参数创建一个countplot。

以下程序演示了相同的功能:

2. 使用hue参数表示两个分类变量

示例:

import matplotlib.pyplot as plt  
import seaborn as sns  
import pandas as pd  
#loading the dataset 'tips'  
df=pd.read_csv("/content/tips.csv")  
#plotting the graph  
sns.countplot(x='sex',hue='smoker',data=df)  
plt.show()  

输出:

256-2.png

在下一个示例中,我们将考虑y轴,并创建一个水平的countplot。

以下程序演示了相同的功能:

3. 创建水平图

示例:

import matplotlib.pyplot as plt  
import seaborn as sns  
import pandas as pd  
#loading the dataset 'tips'  
df=pd.read_csv("/content/tips.csv")  
#plotting the graph  
sns.countplot(y='sex',hue='smoker',data=df)  
plt.show()  

输出:

256-3.png

现在让我们看看颜色调色板如何提升数据的呈现。

在下一个示例中,我们将使用"palette"参数。

以下程序演示了相同的功能:

4. 使用调色板

示例:

import matplotlib.pyplot as plt  
import seaborn as sns  
import pandas as pd  
#loading the dataset 'tips'  
df=pd.read_csv("/content/tips.csv")  
#plotting the graph  
sns.countplot(x='sex', data=df, palette='Set1')  
plt.show()  

输出:

256-4.png

在下一个示例中,我们将使用参数"color",让我们看看它是如何工作的。

以下程序演示了相同的功能:

5. 使用参数'color'

示例:

import matplotlib.pyplot as plt  
import seaborn as sns  
import pandas as pd  
#loading the dataset 'train'  
df=pd.read_csv("/content/train.csv")  
#plotting the graph  
sns.countplot(x='Pclass',hue='Sex', data=df, color='green')  
plt.show()  

输出:

256-5.png

现在,我们将使用参数'saturation',并查看它如何影响数据的呈现。

以下程序演示了相同的功能:

6. 使用参数'saturation'

示例:

import matplotlib.pyplot as plt  
import seaborn as sns  
import pandas as pd  
#loading the dataset 'train'  
df=pd.read_csv("/content/train.csv")  
#plotting the graph  
sns.countplot(x='Pclass',data=df, color='green', saturation=0.1)  
plt.show()  

输出:

256-6.png

最后,在最后一个示例中,我们将使用参数linewidthedgecolor

  • 使用matplotlib.axes.Axes.bar()

示例:

import matplotlib.pyplot as plt  
import seaborn as sns  
import pandas as pd  
#loading the dataset 'train'  
df=pd.read_csv("/content/train.csv")  
sns.countplot(x='Sex', data=df, color="green", facecolor=(0,0,0,0), linewidth=5, edgecolor=sns.color_palette("BrBG",2))  
plt.show() 

输出:

256-7.png

标签: Tkinter教程, Tkinter安装, Tkinter库, Tkinter入门, Tkinter学习, Tkinter入门教程, Tkinter, Tkinter进阶, Tkinter指南, Tkinter学习指南, Tkinter进阶教程, Tkinter编程