时间序列 - Python 库
由于 Python 代码易于编写和理解,并且拥有各种各样的开源库,因此在进行机器学习的个人中享有盛誉。以下介绍了我们将在接下来的章节中使用的一些此类开源库。
NumPy
Numerical Python 是一个用于科学计算的库。它基于 N 维数组对象,并提供基本的数学功能,例如大小、形状、均值、标准差、最小值、最大值,以及一些更复杂的函数,例如线性代数函数和傅里叶变换。随着我们在这个教程中继续学习,您将了解更多关于这些函数的信息。
Pandas
这个库提供了高效且易于使用的数数据结构,例如序列、数据帧和面板。它增强了 Python 的功能,从简单的数数据收集和准备到数数据分析。Pandas 和 NumPy 这两个库使得对小型到超大型数据集的操作变得非常简单。要了解更多关于这些函数的信息,请遵循本教程。
SciPy
Science Python 是一个用于科学和技术计算的库。它提供了用于优化、信号和图像处理、积分、插值和线性代数的功能。在执行机器学习时,此库非常方便。随着我们在这个教程中继续学习,我们将讨论这些功能。
Scikit-learn
这个库是一个 SciPy 工具包,广泛用于统计建模、机器学习和深度学习,因为它包含各种可定制的回归、分类和聚类模型。它与 NumPy、Pandas 和其他库配合良好,使其更易于使用。
Statsmodels
与 Scikit-learn 一样,此库用于统计数据探索和统计建模。它也与其他 Python 库配合良好。
Matplotlib
这个库用于以各种格式(例如线图、条形图、热力图、散点图、直方图等)进行数据可视化。它包含从绘图到标记所需的所有与图形相关的功能。随着我们在这个教程中继续学习,我们将讨论这些功能。
这些库对于开始使用任何类型的数据进行机器学习非常重要。
除了上面讨论的库之外,另一个特别重要的处理时间序列的库是:
Datetime
这个库及其两个模块(datetime 和 calendar)提供了读取、格式化和操作时间所需的所有 datetime 功能。
我们将在接下来的章节中使用这些库。