如何使用 fillna() 方法用元素的平均值替换序列中的 NaN 值?
在 Pandas 数据清洗的过程中,替换缺失值起着非常重要的作用,在某些情况下,我们必须用序列元素的平均值替换这些缺失值。这可以通过使用 fillna() 方法来实现。
此 Pandas series.fillna() 方法的基本操作用于用指定值替换缺失值(Nan 或 NA)。最初,该方法会验证所有 Nan 值,并用指定的替换值替换它们。
示例 1
在这里,我们将看到 series.fillna() 方法如何用平均值替换缺失值。
# importing pandas package
import pandas as pd
import numpy as np
# create a series
s = pd.Series([69, np.nan, np.nan, 10, 30, 52, 70, np.nan, 54, 79, np.nan])
print(s)
# replace Missing values with an average value
result = s.fillna(s.mean())
print('Result:')
print(result)解释
在下面的示例中,我们将用序列元素的平均值替换缺失值。为此,我们将 series.mean() 函数作为参数应用于 fillna() 方法。
输出
输出如下所示:
0 69.0 1 NaN 2 NaN 3 10.0 4 30.0 5 52.0 6 70.0 7 NaN 8 54.0 9 79.0 10 NaN dtype: float64 Result: 0 69.0 1 52.0 2 52.0 3 10.0 4 30.0 5 52.0 6 70.0 7 52.0 8 54.0 9 79.0 10 52.0 dtype: float64
如您所见,值 52.0(平均值)替换了索引位置 1、2、5、7 和 10 中的 Nan 值。
示例 2
让我们再举一个例子,用序列元素的平均值替换缺失值 Nan/NA。
# importing pandas package
import pandas as pd
import numpy as np
# create a series
s = pd.Series([np.nan, 49, 45, 47, 99, 99, np.nan, np.nan, 94, np.nan])
print(s)
# replace Missing values with an average value
result = s.fillna(s.mean())
print('Result:')
print(result)解释
最初,我们使用整数列表和 Nan 值创建了一个 Pandas 序列对象,然后使用平均值调用了 fillna() 方法。通过使用 series.mean() 函数,我们计算了平均值,然后将该平均值作为 fillna() 方法的参数应用。
输出
输出如下所示:
0 NaN 1 49.0 2 45.0 3 47.0 4 99.0 5 99.0 6 NaN 7 NaN 8 94.0 9 NaN dtype: float64 Result: 0 72.166667 1 49.000000 2 45.000000 3 47.000000 4 99.000000 5 99.000000 6 72.166667 7 72.166667 8 94.000000 9 72.166667 dtype: float64
平均值 72.166667 替换了缺失值,索引位置为 0、6、7 和 9。
广告
数据结构
网络
关系型数据库管理系统
操作系统
Java
iOS
HTML
CSS
Android
Python
C 编程
C++
C#
MongoDB
MySQL
Javascript
PHP