如何在 Pandas Python 中找到数据框中特定列的标准差?


标准差说明了数据集中值的分布情况。它们还说明了数据集中值与数据集中列的算术平均值的距离。

有时,可能需要获取本质上为数值类型的特定列的标准差。这就是可以使用 std() 函数的地方。需要计算平均值的列可以索引到数据框中,并且可以使用点运算符在此列上调用平均值函数。

还可以传递列的索引以查找标准差。

让我们来看一个演示 -

示例

 在线演示

import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])}
print("The dataframe is :")
my_df = pd.DataFrame(my_data)
print(my_df)
print("The standard deviation of column 'Age' is :")
print(my_df['Age'].std())
print("The standard deviation of column 'value' is :")
print(my_df['value'].std())

输出

The dataframe is :
   Name  Age   value
0  Tom   45   8.79
1  Jane  67   23.24
2  Vin   89   31.98
3  Eve   12   78.56
4  Will  23   90.20
The standard deviation of column 'Age' is :
31.499206339207976
The standard deviation of column 'value' is :
35.747101700697364

解释

  • 导入所需的库,并为方便使用赋予别名。

  • 创建由键和值组成的系列字典,其中值实际上是系列数据结构。

  • 稍后将此字典作为参数传递给“pandas”库中存在的“Dataframe”函数

  • 在控制台上打印数据框。

  • 我们正在查看计算包含数值的特定列的标准差。

  • 通过使用点运算符指定列的名称,在数据框上调用“std”函数。

  • 在控制台上打印数值列的标准差。

更新于: 2020-12-10

6K+ 浏览量

开启你的 职业生涯

通过完成课程获得认证

立即开始
广告