Python - 重新排列 Pandas DataFrame 中的数据
我们可以通过对特定列进行分类,轻松地重新排列数据。在此,我们将对“结果”列进行分类,即数字形式的及格和不及格值。
导入必需的库 −
import pandas as pd
使用 2 列创建 DataFrame −
dataFrame = pd.DataFrame(
{
"Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
}
)使用 map() 函数重新排列数据,并只将“及格”设置为 1,“不及格”设置为 0 −
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
示例
以下是代码 −
import pandas as pd
# Create DataFrame
dataFrame = pd.DataFrame(
{
"Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
}
)
print"DataFrame ...\n",dataFrame
# reshaping into numbers
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
print"\nReshaped DataFrame ...\n",dataFrame输出
将产生以下输出
DataFrame ... Result Student 0 Pass Jack 1 Fail Robin 2 Fail Ted 3 Pass Scarlett 4 Pass Kat Reshaped DataFrame ... Result Student 0 1 Jack 1 0 Robin 2 0 Ted 3 1 Scarlett 4 1 Kat
广告
数据结构
网络
RDBMS
操作系统
Java
iOS
HTML
CSS
安卓
Python
C 编程
C++
C#
MongoDB
MySQL
Javascript
PHP