如何在 Pandas Python 中汇总数据?
可以使用不同的函数来获取有关数据的大量信息。但如果我们希望获取数据的所有信息,可以使用“describe”函数。
此函数将提供诸如“计数”、“均值”、“标准差”、“第25百分位数”、“第50百分位数”和“第75百分位数”等信息。
示例
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']), 'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20]) } print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The description of data is :") print(my_df.describe())
输出
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The description of data is : Age value count 5.000000 5.000000 mean 47.200000 46.554000 std 31.499206 35.747102 min 12.000000 8.790000 25% 23.000000 23.240000 50% 45.000000 31.980000 75% 67.000000 78.560000 max 89.000000 90.200000
解释
- 导入所需的库,并为方便使用赋予别名。
- 创建由键和值组成的系列字典,其中值实际上是系列数据结构。
- 此字典随后作为参数传递给pandas库中的“Dataframe”函数
- 数据框打印在控制台上。
- 我们正在寻找获取有关数据的所有信息。
- 在数据框上调用“describe”函数。
- 描述打印在控制台上。
广告