Python — 计算 Pandas DataFrame 中组的第一项值


要计算组的第一项值,请使用 groupby.first() 方法。首先,使用别名导入所需库 −

import pandas as pd;

创建一个有 3 列的 DataFrame −

dataFrame = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place": ['Delhi','Bangalore','Pune','Punjab','Chandigarh','Mumbai'],"Units": [100, 150, 50, 80, 110, 90]
   }
)

现在,按某列对 DataFrame 进行分组 −

groupDF = dataFrame.groupby("Car")

计算组的第一项值并重置索引 −

res = groupDF.first()
res = res.reset_index()

示例

以下是完整代码 −

import pandas as pd;

dataFrame = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place": ['Delhi','Bangalore','Pune','Punjab','Chandigarh','Mumbai'],"Units": [100, 150, 50, 80, 110, 90]
   }
)

print("DataFrame ...\n",dataFrame)

# grouping DataFrame by column Car
groupDF = dataFrame.groupby("Car")

res = groupDF.first()
res = res.reset_index()

print("\nFirst of group values = \n",res)

输出

这将产生以下输出。将显示重复值的首次出现,即组的第一项值 −

DataFrame ...
     Car       Place   Units
0    BMW       Delhi     100
1  Lexus   Bangalore     150
2    BMW        Pune      50
3  Tesla      Punjab      80
4  Lexus  Chandigarh     110
5  Tesla      Mumbai      90

First of group values =
     Car      Place   Units
0    BMW      Delhi     100
1  Lexus  Bangalore     150
2  Tesla     Punjab      80

更新于: 2021-09-29

120 次浏览

开启您的 职业生涯

完成课程以获得认证

开始学习
广告