如何使用 fillna() 方法用元素的平均值替换序列中的 NaN 值?


在 Pandas 数据清洗的过程中,替换缺失值起着非常重要的作用,在某些情况下,我们必须用序列元素的平均值替换这些缺失值。这可以通过使用 fillna() 方法来实现。

此 Pandas series.fillna() 方法的基本操作用于用指定值替换缺失值(Nan 或 NA)。最初,该方法会验证所有 Nan 值,并用指定的替换值替换它们。

示例 1

在这里,我们将看到 series.fillna() 方法如何用平均值替换缺失值。

# importing pandas package
import pandas as pd
import numpy as np

# create a series
s = pd.Series([69, np.nan, np.nan, 10, 30, 52, 70, np.nan, 54, 79, np.nan])
print(s)

# replace Missing values with an average value
result = s.fillna(s.mean())
print('Result:')
print(result)

解释

在下面的示例中,我们将用序列元素的平均值替换缺失值。为此,我们将 series.mean() 函数作为参数应用于 fillna() 方法。

输出

输出如下所示:

0    69.0
1     NaN
2     NaN
3    10.0
4    30.0
5    52.0
6    70.0
7     NaN
8    54.0
9    79.0
10    NaN
dtype: float64

Result:
0    69.0
1    52.0
2    52.0
3    10.0
4    30.0
5    52.0
6    70.0
7    52.0
8    54.0
9    79.0
10   52.0
dtype: float64

如您所见,值 52.0(平均值)替换了索引位置 1、2、5、7 和 10 中的 Nan 值。

示例 2

让我们再举一个例子,用序列元素的平均值替换缺失值 Nan/NA。

# importing pandas package
import pandas as pd
import numpy as np

# create a series
s = pd.Series([np.nan, 49, 45, 47, 99, 99, np.nan, np.nan, 94, np.nan])
print(s)

# replace Missing values with an average value
result = s.fillna(s.mean())
print('Result:')
print(result)

解释

最初,我们使用整数列表和 Nan 值创建了一个 Pandas 序列对象,然后使用平均值调用了 fillna() 方法。通过使用 series.mean() 函数,我们计算了平均值,然后将该平均值作为 fillna() 方法的参数应用。

输出

输出如下所示:

0    NaN
1    49.0
2    45.0
3    47.0
4    99.0
5    99.0
6    NaN
7    NaN
8    94.0
9    NaN
dtype: float64

Result:
0    72.166667
1    49.000000
2    45.000000
3    47.000000
4    99.000000
5    99.000000
6    72.166667
7    72.166667
8    94.000000
9    72.166667
dtype: float64

平均值 72.166667 替换了缺失值,索引位置为 0、6、7 和 9。

更新于: 2022年3月7日

17K+ 浏览量

开启您的 职业生涯

通过完成课程获得认证

立即开始
广告

© . All rights reserved.