如何在 Pandas Python 中汇总数据?


可以使用不同的函数来获取有关数据的大量信息。但如果我们希望获取数据的所有信息,可以使用“describe”函数。

此函数将提供诸如“计数”、“均值”、“标准差”、“第25百分位数”、“第50百分位数”和“第75百分位数”等信息。

示例

 在线演示

import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),
'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])
}
print("The dataframe is :")
my_df = pd.DataFrame(my_data)
print(my_df)
print("The description of data is :")
print(my_df.describe())

输出

The dataframe is :
   Name  Age   value
0  Tom   45   8.79
1  Jane  67   23.24
2  Vin   89   31.98
3  Eve   12   78.56
4  Will  23   90.20
The description of data is :
          Age     value
count  5.000000  5.000000
mean  47.200000  46.554000
std   31.499206  35.747102
min   12.000000  8.790000
25%   23.000000  23.240000
50%   45.000000  31.980000
75%   67.000000  78.560000
max   89.000000  90.200000

解释

  • 导入所需的库,并为方便使用赋予别名。
  • 创建由键和值组成的系列字典,其中值实际上是系列数据结构。
  • 此字典随后作为参数传递给pandas库中的“Dataframe”函数
  • 数据框打印在控制台上。
  • 我们正在寻找获取有关数据的所有信息。
  • 在数据框上调用“describe”函数。
  • 描述打印在控制台上。

更新于:2020年12月10日

88 次浏览

启动您的职业生涯

完成课程获得认证

开始学习
广告