如何在 Python 中向现有的 DataFrame 添加新列?


DataFrame 是一种二维数据结构,其中数据以表格格式存储,以行和列的形式表示。

它可以被视为 SQL 数据表或 Excel 表格的表示形式。它可以使用以下构造函数创建:

pd.Dataframe(data, index, columns, dtype, copy)

可以通过不同的方式向 DataFrame 添加新列。

让我们看看其中一种方法,即首先创建一个 Series 数据结构,然后将其作为附加列传递到现有的 DataFrame 中。

让我们看看代码的实际操作:

示例

 在线演示

import pandas as pd
my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']),
'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd'])}
my_df = pd.DataFrame(my_data)
print("The dataframe is :")
print(my_df)
print ("Adding a new column to the dataframe by passing it as a Series structure :")
my_df['ef']=pd.Series([56, 78, 32],index=['a','b','c'])
print("After adding a new column to the dataframe, :")
print(my_df)

输出

The dataframe is :
   ab   cd
a  1.0  1
b  8.0  2
c  7.0  0
d  NaN  9
Adding a new column to the dataframe by passing it as a Series structure :
After adding a new column to the dataframe, :
    ab  cd  ef
a  1.0  1   56.0
b  8.0  2  78.0
c  7.0  0  32.0
d  NaN  9  NaN

解释

  • 导入所需的库,并为方便使用赋予别名。

  • 创建一个字典数据结构,其中一个字典中存在键值对。

  • 以此方式,创建多个字典并存储在列表中。

  • 键值对中的“value”实际上是 Series 数据结构。

  • 索引也是一个自定义的值列表。

  • 稍后将此字典作为参数传递给“pandas”库中存在的“DataFrame”函数

  • 通过将字典值的列表作为参数传递给它来创建 DataFrame。

  • 创建另一个新列并在其中初始化值。

  • 此新列被索引到原始 DataFrame。

  • 这样,新列就被绑定到 DataFrame。

  • DataFrame 在控制台上打印。

注意 - “NaN” 代表“非数字”,这意味着特定 [行,列] 值没有任何有效条目。

更新于: 2020-12-10

180 次浏览

启动您的 职业生涯

通过完成课程获得认证

开始
广告