pandas.series.array 属性有什么作用?
“array” 是 pandas series 属性之一,它将返回一个存储着 series 中值的 pandas ExtensionArray。“array” 用于获得底层数据的零拷贝引用。
结果数组与 NumPy 数组不同,它是一个 ExtensionArray,并且它有不同的数组类型,具体取决于 series 中数据(dtype)的类型。
例 1
import pandas as pd # create pandas series with numerical values s1 = pd.Series([1,2,3,4]) print(s1) print(s1.array)
说明
“s1” 是一个 pandas series 对象,它是使用长度为 4 的整数值创建的。我们已经将 pandas array 属性应用于这个 series 对象 s1。
输出
0 1 1 2 2 3 3 4 dtype: int64 <PandasArray> [1, 2, 3, 4] Length: 4, dtype: int64
为 series 对象“s1” 创建了一个结果 ExtensionArray,这可以在上面的输出块中看到,它是 PandasArray。
例 2
import pandas as pd # creating dates date = pd.date_range("2021-06-01", periods=5, freq="M") # creating pandas Series with date sequence s2 = pd.Series(date) print(s2) print(s2.array)
说明
让我们创建一个具有日期时间序列值的 series,并使用 series 属性“array”获取一个 ExtensionArray。
输出
0 2021-06-30 1 2021-07-31 2 2021-08-31 3 2021-09-30 4 2021-10-31 dtype: datetime64[ns] <DatetimeArray> ['2021-06-30 00:00:00', '2021-07-31 00:00:00', '2021-08-31 00:00:00', '2021-09-30 00:00:00', '2021-10-31 00:00:00'] Length: 5, dtype: datetime64[ns]
在下面的示例中,我们可以看到使用"array"属性创建的 DatatimeArray。这个 DatatimeArray 是 ExtensionArray 的一种类型,用于 pandas 中的 DateTime dtype 数据。
对于任何其他第三方 dtype,数组类型都将是 ExtensionArray。
广告