Python 中的 Pandas 是什么?


Pandas

Pandas 是 Python 编程语言中功能强大的开源库之一,用于数据分析和数据处理。如果您想处理任何表格数据,例如来自数据库或任何其他形式的数据(如 CSV、JSON、Excel 等),那么 Pandas 是最佳工具。

历史

2008 年,开发人员 Wes McKinney 开始开发 Pandas,用于高性能、灵活的数据分析。

突出特点

  • Pandas 将降低复杂性,使我们的工作变得简单,并且可以应用于任何有序和无序类型的数据。Pandas 的输出也是一个名为 DataFrame 的表格形式。

  • 我们可以使用 Matplotlib(也是一个 Python 库)绘制一些可视化图形,它提供了不同的绘图类型,例如散点图、条形图、箱线图等。

示例

让我们看一个例子。

df = pd.DataFrame({'x': [3, 6, 8, 7, 12, 5, 10, 18],'y': [2, 5, 12, 3, 8, 4, 15, 6]})
df.plot()

输出

在上面的代码和输出图形中,我们看到了我们数据的一个简单的基本可视化图。

  • 从特定列或行过滤数据、选择、切片和提取在 Pandas 中非常灵活,Pandas 中提供了许多方法来执行所有这些操作。

  • 我们可以在 Pandas 中按列和按行组合或连接多个表,还可以对数据表执行连接/合并操作。

  • 时间序列也是 Pandas 的功能之一,如果您想处理时间和日期,Pandas 将为您提供强大的支持。

  • 要执行数学运算,无需循环遍历数据表的所有行。这些操作可以通过在 Pandas 中使用一些直接方法非常轻松地完成,如下面的示例所示。

示例

Example : pandas.DataFrame.mean()

在上面的代码块中,Pandas 表示包的名称,DataFrame 表示表格数据,mean() 方法将为您提供每列数据的平均值。

更新于: 2021-11-18

355 次浏览

启动您的 职业生涯

通过完成课程获得认证

立即开始
广告