Python Pandas - 面板 (Panel)



面板是一个三维数据容器。“面板数据”一词源于计量经济学,并且部分解释了 pandas 的名称——pan(el)-da(ta)-s。

Panel 类已弃用,并在最新版本的 pandas 中被移除。表示三维数据的推荐方法是通过 to_frame() 方法在 DataFrame 上使用多级索引,或使用 xarray 包。pandas 提供 to_xarray() 方法来自动执行此转换。

这三个轴的名称旨在为描述涉及面板数据的操作提供一些语义含义。它们是:

  • items:轴 0,每个项目对应于内部包含的 DataFrame。

  • major_axis:轴 1,它是每个 DataFrame 的索引(行)。

  • minor_axis:轴 2,它是每个 DataFrame 的列。

pandas.Panel()

可以使用以下构造函数创建一个 Panel:

pandas.Panel(data, items, major_axis, minor_axis, dtype, copy)

构造函数的参数如下:

参数 描述
data 数据采用多种形式,例如 ndarray、series、map、列表、字典、常量以及另一个 DataFrame
items axis=0
major_axis axis=1
minor_axis axis=2
dtype 每列的数据类型
copy 复制数据。默认值,false

创建面板

可以使用多种方法创建面板,例如:

  • 从 ndarrays 创建
  • 从 DataFrame 字典创建

从三维 ndarray 创建

# creating an empty panel
import pandas as pd
import numpy as np

data = np.random.rand(2,4,5)
p = pd.Panel(data)
print(p)

输出如下:

<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)
Items axis: 0 to 1
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 4

注意:观察空面板和上面面板的维度,所有对象都是不同的。

从 DataFrame 对象的字典创建

#creating an empty panel
import pandas as pd
import numpy as np

data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print(p)

输出如下:

Dimensions: 2 (items) x 4 (major_axis) x 3 (minor_axis)
Items axis: Item1 to Item2
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 2

创建空面板

可以使用 Panel 构造函数创建空面板,如下所示:

#creating an empty panel
import pandas as pd
p = pd.Panel()
print(p)

输出如下:

<class 'pandas.core.panel.Panel'>
Dimensions: 0 (items) x 0 (major_axis) x 0 (minor_axis)
Items axis: None
Major_axis axis: None
Minor_axis axis: None

从面板中选择数据

使用以下方法从面板中选择数据:

  • Items
  • Major_axis
  • Minor_axis

使用 Items

# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print(p['Item1'])

输出如下:

            0          1          2
0    0.488224  -0.128637   0.930817
1    0.417497   0.896681   0.576657
2   -2.775266   0.571668   0.290082
3   -0.400538  -0.144234   1.110535

我们有两个项目,我们检索了 item1。结果是一个包含 4 行 3 列的 DataFrame,它们分别是Major_axisMinor_axis 维度。

使用 major_axis

可以使用方法panel.major_axis(index)访问数据。

# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print(p.major_xs(1))

输出如下:

      Item1       Item2
0   0.417497    0.748412
1   0.896681   -0.557322
2   0.576657       NaN

使用 minor_axis

可以使用方法panel.minor_axis(index)访问数据。

# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print(p.minor_xs(1))

输出如下:

       Item1       Item2
0   -0.128637   -1.047032
1    0.896681   -0.557322
2    0.571668    0.431953
3   -0.144234    1.302466

注意:观察维度的变化。

广告