Python - 重新排列 Pandas DataFrame 中的数据


我们可以通过对特定列进行分类,轻松地重新排列数据。在此,我们将对“结果”列进行分类,即数字形式的及格和不及格值。

导入必需的库 −

import pandas as pd

使用 2 列创建 DataFrame −

dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']

   }
)

使用 map() 函数重新排列数据,并只将“及格”设置为 1,“不及格”设置为 0 −

dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })

示例

以下是代码 −

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
   }
)

print"DataFrame ...\n",dataFrame

# reshaping into numbers
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })

print"\nReshaped DataFrame ...\n",dataFrame

输出

将产生以下输出

DataFrame ...
   Result   Student
0    Pass      Jack
1    Fail     Robin
2    Fail       Ted
3    Pass  Scarlett
4    Pass       Kat

Reshaped DataFrame ...
   Result   Student
0       1      Jack
1       0     Robin
2       0       Ted
3       1  Scarlett
4       1       Kat

更新于: 2021-09-20

657 次浏览

开启你的 职业生涯

完成课程,获取认证

开始
广告
© . All rights reserved.