Pandas教程-Pandas Series.std()
Pandas std() 函数用于计算给定一组数字、DataFrame、列和行的标准偏差。在计算标准偏差时,我们需要导入名为 "statistics" 的包进行中位数的计算。
默认情况下,标准偏差通过 N-1 标准化,可以通过 ddof 参数进行更改。
语法:
Series.std(axis=None, skipna=None, level=None, ddof=1, numeric_only=None, **kwargs)
参数:
- axis: {index (0), columns (1)}
- skipna: 排除所有 NA/空值。如果整行/列中存在 NA,则结果将为 NA。
- level: 沿着特定级别计算,并且如果轴是 MultiIndex(层次化)的话,将折叠成一个标量。
- ddof: 自由度增量。计算中使用的除数是 N - ddof,其中 N 代表元素的数量。
- numeric_only: 布尔值,默认值 None 它仅包括浮点数、整数、布尔列。如果为 None,它将尝试使用一切,因此只使用数字数据。 对于 Series 来说,这个参数没有实现。
返回值:
如果指定了级别,则返回 Series 或 DataFrame。
示例1:
import pandas as pd
# calculate standard deviation
import numpy as np
print(np.std([4,7,2,1,6,3]))
print(np.std([6,9,15,2,-17,15,4]))
输出
2.1147629234082532
10.077252622027656
示例2:
import pandas as pd
import numpy as np
#Create a DataFrame
info = {
'Name':['Parker','Smith','John','William'],
'sub1_Marks':[52,38,42,37],
'sub2_Marks':[41,35,29,36]}
data = pd.DataFrame(info)
data
# standard deviation of the dataframe
data.std()
输出
sub1_Marks 6.849574
sub2_Marks 4.924429
dtype: float64