如何在 Pandas Python 中找到数据框中特定列的标准差?
标准差说明了数据集中值的分布情况。它们还说明了数据集中值与数据集中列的算术平均值的距离。
有时,可能需要获取本质上为数值类型的特定列的标准差。这就是可以使用 std() 函数的地方。需要计算平均值的列可以索引到数据框中,并且可以使用点运算符在此列上调用平均值函数。
还可以传递列的索引以查找标准差。
让我们来看一个演示 -
示例
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])} print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The standard deviation of column 'Age' is :") print(my_df['Age'].std()) print("The standard deviation of column 'value' is :") print(my_df['value'].std())
输出
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The standard deviation of column 'Age' is : 31.499206339207976 The standard deviation of column 'value' is : 35.747101700697364
解释
导入所需的库,并为方便使用赋予别名。
创建由键和值组成的系列字典,其中值实际上是系列数据结构。
稍后将此字典作为参数传递给“pandas”库中存在的“Dataframe”函数
在控制台上打印数据框。
我们正在查看计算包含数值的特定列的标准差。
通过使用点运算符指定列的名称,在数据框上调用“std”函数。
在控制台上打印数值列的标准差。
广告