从列表创建 Pandas DataFrame


Pandas DataFrame 是一个具有行和列的二维表格,这些行和列是不可变的,这意味着一旦创建它们就不能更改。从头开始使用列表创建 DataFrame 是数据科学和信息技术中的一项常见任务。列表是有序元素的集合,它是 Python 中最常用的数据结构之一。列表可以存储任何类型的值,例如数字、字符串和布尔值。

在本教程中,我将详细解释如何使用分步说明、代码片段和每个子部分的解释,结合实际案例,从列表创建 Pandas DataFrame。

DataFrame 和列表之间有哪些主要区别?

列表是 Python 中的基本数据结构,可以保存任何数据类型的元素集合,而 DataFrame 是一种二维表格结构,类似于电子表格或 SQL 表格,用于以行和列的形式存储数据。以下是 DataFrame 和列表之间的一些主要区别:

  • 结构 - 列表是简单的、一维的值集合,而 DataFrame 是具有行和列的二维表格结构。

  • 数据类型 - 列表可以保存任何数据类型的元素,包括数字、字符串,甚至其他列表,而 DataFrame 旨在以表格格式保存数据,列具有特定的数据类型,例如整数、浮点数和字符串。

  • 大小 - 列表可以保存任意数量的元素,而 DataFrame 通常设计用于保存大量数据,可能包含数百万行和列。

  • 操作 - 列表支持基本操作,例如索引、切片和追加,而 DataFrame 支持更复杂的操作,例如过滤、连接和分组。

  • 数据操作 - 列表提供基本的数据操作功能,而 DataFrame 提供强大的数据操作工具,例如根据特定条件过滤、排序和聚合数据。

先决条件

在我们深入研究任务之前,需要在您的系统上安装一些东西:

推荐设置列表:

  • pip install pandas, bokeh

  • 预计用户可以使用任何独立的 IDE,例如 VS-Code、PyCharm、Atom 或 Sublime text。

  • 也可以使用在线 Python 编译器,例如 Kaggle.com、Google Cloud 平台或任何其他编译器。

  • 更新版本的 Python。在撰写本文时,我使用了 3.10.9 版本。

  • 了解如何使用 Jupyter notebook。

  • 虚拟环境的知识和应用将是有益的,但不是必需的。

  • 还预计用户对统计学和数学有良好的理解。

所需步骤

导入库

要在 Pandas 中创建 DataFrame,我们需要导入 Pandas 库。以下代码用于导入 Pandas 库:

import pandas as pd

创建列表

在我们使用列表创建 DataFrame 之前,我们首先需要创建列表来存储数据。在本节中,我将向您展示如何使用简单数据和实际案例创建列表。

创建姓名列表

names = ['John', 'Mary', 'Peter', 'Jane', 'Daniel']

在上面的代码片段中,我们创建了一个名为 `names` 的列表,其中包含五个字符串值,表示个人的姓名。

创建年龄列表

ages = [32, 25, 41, 29, 36]

在上面的代码片段中,我们创建了一个名为 `ages` 的列表,其中包含五个整数值,表示个人的年龄。

创建布尔值列表

current_status = [True, False, True, False, True]

在上面的代码片段中,我们创建了一个名为 `current_status` 的列表,其中包含五个布尔值,表示个人的当前状态。

从列表创建 DataFrame

一旦我们有了包含数据的列表,我们就可以使用 `pd.DataFrame()` 函数在 Pandas 中创建 DataFrame。我们可以将列表作为参数传递给 `pd.DataFrame()` 函数。以下代码用于从列表创建 DataFrame:

df = pd.DataFrame(list(zip(names, ages, current_status)), columns=['Name', 'Age', 'Current_Status'])

在上面的代码片段中,我们首先使用 `zip()` 函数创建了一个元组列表。`zip()` 函数将列表组合成一个元组列表。然后,我们将此元组列表作为第一个参数传递给 `pd.DataFrame()` 函数。

传递给 `pd.DataFrame()` 函数的第二个参数是 DataFrame 的列名列表。在本例中,我们使用 `columns=['Name', 'Age', 'Current_Status']` 将列名指定为 `Name`、`Age` 和 `Current_Status`。

查看 DataFrame

创建 DataFrame 后,我们可以使用 `.head()` 函数查看 DataFrame 的前几行。以下代码用于显示 DataFrame 的前几行:

print(df.head())

在上面的代码片段中,我们使用 `.head()` 函数显示了 DataFrame 的前几行。

输出

    Name   Age  Current_Status
0   John   32            True
1   Mary   25           False
2   Peter  41            True
3   Jane   29           False
4   Daniel 36            True

在上面的输出中,我们可以看到从列表创建 DataFrame 的结果。

结论

在本教程中,我提供了有关如何从列表创建 Pandas DataFrame 的分步指南。我演示了如何导入 Pandas 库、创建列表以及如何使用 `pd.DataFrame()` 函数创建 DataFrame。此外,我还展示了如何使用 `.head()` 函数查看 DataFrame 的前几行。通过遵循这些说明,您现在应该能够使用实际案例从列表创建 Pandas DataFrame。

更新于: 2023年4月25日

3K+ 阅读量

开启您的 职业生涯

通过完成课程获得认证

立即开始
广告