Python — 计算 Pandas DataFrame 中组的第一项值
要计算组的第一项值,请使用 groupby.first() 方法。首先,使用别名导入所需库 −
import pandas as pd;
创建一个有 3 列的 DataFrame −
dataFrame = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place": ['Delhi','Bangalore','Pune','Punjab','Chandigarh','Mumbai'],"Units": [100, 150, 50, 80, 110, 90] } )
现在,按某列对 DataFrame 进行分组 −
groupDF = dataFrame.groupby("Car")
计算组的第一项值并重置索引 −
res = groupDF.first() res = res.reset_index()
示例
以下是完整代码 −
import pandas as pd; dataFrame = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place": ['Delhi','Bangalore','Pune','Punjab','Chandigarh','Mumbai'],"Units": [100, 150, 50, 80, 110, 90] } ) print("DataFrame ...\n",dataFrame) # grouping DataFrame by column Car groupDF = dataFrame.groupby("Car") res = groupDF.first() res = res.reset_index() print("\nFirst of group values = \n",res)
输出
这将产生以下输出。将显示重复值的首次出现,即组的第一项值 −
DataFrame ... Car Place Units 0 BMW Delhi 100 1 Lexus Bangalore 150 2 BMW Pune 50 3 Tesla Punjab 80 4 Lexus Chandigarh 110 5 Tesla Mumbai 90 First of group values = Car Place Units 0 BMW Delhi 100 1 Lexus Bangalore 150 2 Tesla Punjab 80
广告