Pandas 系列中的 count 方法有什么作用?


Pandas 系列中的 count 方法将返回一个整数值,该值表示系列对象中存在的元素总数。它只计算有效元素,并忽略系列数据中的无效元素。

无效元素就是缺失值,例如 Nan、Null 和 None。count 方法不会将缺失值计算为元素,它会忽略缺失值并计算剩余的值。

示例

# importing pandas packages
import pandas as pd

d = {'a':'A','c':"C",'d':'D','e':'E'}

#creating a series with null data
s_obj = pd.Series(d, index=list('abcdefg'))

print(s_obj)

# using count method
print('
Result',s_obj.count())

解释

我们使用一个 Python 字典创建了一个 Pandas 系列对象,其中包含文本类型元素,在创建系列对象时,我们通过使用新的索引标签指定 index 属性添加了一些 Nan 数据(空值)。这些新添加的索引标签没有任何特定数据,因此它将在该索引位置创建一个空元素。

输出

a    A
b  NaN
c    C
d    D
e    E
f  NaN
g  NaN
dtype: object

Result 4

在上面的输出块中,我们可以看到 Pandas 系列对象“s_obj”。它有 7 个索引和值对,以及 3 个缺失值,表示为 NaN。

在上面的代码块中,我们可以看到 Pandas 系列的 count 方法的输出,即“结果 4”。这意味着,我们的系列对象 s_obj 中只有 4 个有效元素,其余所有元素都是无效元素。

示例

# importing pandas packages
import pandas as pd
import numpy as np


#creating a series with null data
s_obj = pd.Series([2, 9, 6, None, 5, 9, np.nan])

print(s_obj)

# using count method
print('
Values count:',s_obj.count())

解释

在下面的示例中,我们使用 Python 列表创建了另一个 Pandas 系列对象,其中包含一些缺失值。在该列表中,总共有 7 个元素和 2 个缺失元素。一个缺失元素由 Python 的 None 关键字创建,另一个元素由 NumPy 属性 nan 创建。

输出

0   2.0
1   9.0
2   6.0
3   NaN
4   5.0
5   9.0
6   NaN
dtype: float64

Values count: 5

我们可以看到系列对象“s_obj”和 count 方法的输出。这里有 5 个有效元素来自 7 个元素的系列对象。

更新于: 2021年11月17日

436 次浏览

开启你的 职业生涯

通过完成课程获得认证

开始学习
广告