Pandas 是否依赖于 NumPy?


Pandas 基于 NumPy 构建,这意味着 Python pandas 包依赖于 NumPy 包,并且 pandas 还与许多其他第三方库集成。所以我们可以说 NumPy 是 Pandas 运行所必需的。

pandas 库在 pandas 数据对象的实现中大量依赖于 NumPy 数组。

示例

import pandas as pd
df = pd.DataFrame({'A':[1,2,3,4], 'B':[5,6,7,8]})
print('Type of DataFrame: ',type(df))

print('Type of single Column A: ',type(df['A']))

print('Type of values in column A',type(df['A'].values))

print(df['A'].values)

解释

df 变量存储一个使用 Python 字典创建的 DataFrame 对象,此 DataFrame 具有名为 A 和 B 的两列。在上面的代码的第三行中,我们尝试显示 DataFrame 的类型,它将显示 pandas core DataFrame。第四行将打印单列 A 的类型,结果输出将是 pandas Series。第五行将显示单列 A 中可用值的类型。

输出

Type of DataFrame: <class 'pandas.core.frame.DataFrame'>
Type of single Column A: <class 'pandas.core.series.Series'>
Type of values in column A <class 'numpy.ndarray'>

array([1, 2, 3, 4], dtype=int64)

输出的第三行显示数据在上面的 pandas 示例中表示 NumPy 数组对象。在我们的示例中,我们甚至没有导入 NumPy 包。

示例

import pandas as pd
df = pd.DataFrame([['a','b'],['c','d'],['e','f'],['g','h']], columns=['col1','col2'])
print('Type of DataFrame: ',type(df))

print('Type of single Column A: ',type(df['col1']))

print('Type of values in column A',type(df['col1'].values))

print(df['col1'].values)

解释

在下面的示例中,我们有一个使用 Python 列表列表创建的 DataFrame df。此 DataFrame df 具有名为 col1 和 col2 的两列。我们尝试打印单列“col1”的类型,结果输出将是 pandas Series。如果我们打印该列 col1 中可用值的类型,我们可以看到输出将是 numpy.ndarray。

输出

Type of DataFrame: <class 'pandas.core.frame.DataFrame'>
Type of single Column A: <class 'pandas.core.series.Series'>
Type of values in column A <class 'numpy.ndarray'>
['a' 'c' 'e' 'g']

现在我们可以说 pandas 列可以基于 NumPy 数组对象构建。在使用 Pandas 时,您无需专门导入它。当您安装 Pandas 时,您可以看到如果之前没有安装 NumPy,您的包管理器将自动安装 NumPy 包。

更新于:2021年11月17日

2K+ 次浏览

启动您的职业生涯

完成课程获得认证

开始学习
广告