Python - 计算 Pandas DataFrame 中的组值最后一名
要计算组值的最后一名,请使用 groupby.last() 方法。首先,使用别名导入所需的库 −
import pandas as pd;
使用 3 列创建 DataFrame −
dataFrame = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place": ['Delhi','Bangalore','Pune','Punjab','Chandigarh','Mumbai'],"Units": [100, 150, 50, 80, 110, 90] } )
现在,按一列对 DataFrame 进行分组 −
groupDF = dataFrame.groupby("Car")
计算组值的最后一名并重置索引 −
res = groupDF.last() res = res.reset_index()
示例
以下是完整代码。将显示重复值的最后一次出现,即组值的最后一名 −
import pandas as pd; dataFrame = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place": ['Delhi','Bangalore','Pune','Punjab','Chandigarh','Mumbai'],"Units": [100, 150, 50, 80, 110, 90] } ) print"DataFrame ...\n",dataFrame # grouping DataFrame by column Car groupDF = dataFrame.groupby("Car") res = groupDF.last() res = res.reset_index() print"\nLast of group values = \n",res
输出
将生成如下输出 −
DataFrame ... Car Place Units 0 BMW Delhi 100 1 Lexus Bangalore 150 2 BMW Pune 50 3 Tesla Punjab 80 4 Lexus Chandigarh 110 5 Tesla Mumbai 90 Last of group values = Car Place Units 0 BMW Pune 50 1 Lexus Chandigarh 110 2 Tesla Mumbai 90
广告