Pandas中的数据表如何表示?


在Pandas中表示数据表,我们使用一个类似表格的对象,即DataFrame。DataFrame是Pandas中的二维数据结构,这些数据结构可以按列和行的形式存储任何类型的数据。

示例

df = pd.DataFrame({"Name": [ "Harris","William","Elizabeth",],"Age": [22, 35, 58],"Sex": ["male", "male", "female"],})
print(df)

解释

这里我们使用DataFrame对象手动创建了Pandas中的数据表,数据是一个列表字典。创建表格数据时,我们只提到了列标签,而没有提到任何行标签(索引值)。但是你可以在下面的输出块中看到标签值。

输出

       Name Age  Gender
0    Harris 22   male
1   William 35   male
2 Elizabeth 58 female

在输出数据表中,共有3列,分别标记为Name、Age和Gender,以及3行,分别标记为0、1、2索引值。这些索引值是自动生成的,列名是由我们显式定义的(字典中的键名作为列名)。

我们可以看到,Pandas DataFrame创建的数据表看起来与电子表格和SQL表非常相似。

并且DataFrame中的每一列都是一个Pandas Series对象。它只有一列和多行以及索引标签。

示例

print(df.Name)

解释

我们可以使用`df.列名`语法从我们的DataFrame(df)中获取单个列名。生成的Pandas Series对象如下所示。

输出

0    Harris
1   William
2 Elizabeth
Name: Name, dtype: object

来自表格数据(df)的name列的3行数据。此序列的数据类型为object dtype。

通过这种方式,Pandas使用Pandas DataFrame对象表示表格数据。

更新于:2021年11月18日

329 次查看

开启你的职业生涯

通过完成课程获得认证

开始学习
广告