如何在 Python 中将列表转换为 DataFrame 行?
Python 是一种高级、通用的编程语言,近年来变得越来越流行,部分原因在于它能够轻松处理大量数据。Pandas 库是 Python 生态系统中用于处理数据的强大工具之一,它提供了易于使用的 DataFrame 和 Series 等数据结构。
在本教程中,我们将重点关注数据分析中的一项常见任务:使用 pandas 在 Python 中将列表转换为 DataFrame 行。对于任何在 Python 中处理数据的人来说,这都是一项基本技能,因为它允许您快速轻松地将新的数据行添加到 DataFrame 中。我们将在本文后续部分逐步引导您完成将列表转换为 DataFrame 行的过程。
如何在 Python 中将列表转换为 DataFrame 行?
为了将列表转换为 DataFrame 行,我们将使用 Pandas 库。首先,让我们确保我们的系统上已安装 pandas。
Pandas 安装
要安装 pandas,您可以使用名为 pip 的 Python 包管理器,该管理器可以通过命令提示符或终端访问。为此,只需输入下面提供的命令即可。
pip install pandas
以上命令将下载并安装 Pandas 的最新版本到您的系统上。安装完成后,我们可以使用它将列表转换为 DataFrame 行。
将列表转换为 DataFrame 行
要将列表转换为 DataFrame 行,我们首先需要创建一个包含我们要添加数据的列表。此列表应包含与 DataFrame 中列数相同的元素。假设我们有一个 DataFrame,其中包含三列:“姓名”、“年龄”和“城市”。
请考虑以下代码片段以创建新行的数据列表
new_row_data = ['Prince', 26, 'New Delhi]
我们流程中的下一个关键步骤是生成一个全新的 DataFrame 对象,该对象复制了我们现有 DataFrame 的列名。确保列名匹配以使用 pandas 有效地将新行追加到 DataFrame 至关重要。
为此,我们可以创建一个空 DataFrame,该 DataFrame 具有与原始 DataFrame 完全相同的列名。
df = pd.DataFrame(columns=['Name', 'Age', 'City'])
现在我们已经创建了一个具有适当列名的新空 DataFrame,是时候向其中添加一些数据了。我们可以使用 DataFrame 对象的“append”方法来实现此目的,该方法允许我们将新的数据行追加到现有 DataFrame 中。为此,我们需要将表示新数据行的 pandas Series 对象传递给“append”方法。
为了避免覆盖 DataFrame 中的任何现有行,我们必须在追加新行时传递“ignore_index=True”参数。这确保新行作为具有唯一索引号的全新行追加。
请考虑以下代码以使用 append 方法将新行追加到我们的 DataFrame 中。
import pandas as pd # create a list of data for the new row new_row_data = ['Prince', 26, 'New Delhi'] # create a new empty DataFrame with the correct column names df = pd.DataFrame(columns=['Name', 'Age', 'City']) # append the new row to the DataFrame df = df.append(pd.Series(new_row_data, index=df.columns), ignore_index=True) # print the updated DataFrame print(df)
在上面的代码中,我们首先导入 pandas 库。接下来,我们创建一个名为“new_row_data”的列表,其中包含我们希望作为新行添加到 DataFrame 中的值。然后,我们使用与现有 DataFrame 相同的列名创建一个名为“df”的新空 DataFrame 对象。
接下来,我们使用 DataFrame 对象的“append”方法将新行追加到 DataFrame 中。我们将一个 pandas Series 对象传递给“append”方法,该对象表示我们的新数据行。我们使用“ignore_index=True”参数来确保新行作为具有新索引号的新行追加,而不是覆盖现有行。
最后,我们打印更新后的 DataFrame 以确认我们的新行已成功添加。
输出
Name Age City 0 Prince 26 New Delhi
如您在上面的输出中看到的,DataFrame 形式的结构化数据集包含一行和三列,每一列都有其各自的标签。列标签分别是“姓名”、“年龄”和“城市”。
结论
在本教程中,我们学习了如何使用 Pandas 库在 Python 中将列表转换为 DataFrame 行。我们首先确保 pandas 已安装在我们的系统上,然后创建了一个包含我们希望作为新行添加到 DataFrame 中的数据的列表。然后,我们使用与现有 DataFrame 相同的列名创建了一个新的空 DataFrame 对象,并使用“append”方法追加了我们的新数据行。我们使用了“ignore_index=True”参数来确保新行作为具有新索引号的新行追加,而不是覆盖现有行。我们为过程中使用的每种方法都提供了一个示例。