如何使用scikit-learn管道工具中的简化流程将输入数据数组转换为新的数据数组?


Scikit-learn,通常称为sklearn,是Python中用于实现机器学习算法的库。它是一个开源库,因此可以免费使用。

它功能强大且健壮,因为它提供了各种工具来执行统计建模。这包括分类、回归、聚类、降维等等,借助于Python中强大且稳定的接口。

该库基于NumPy、SciPy和Matplotlib库。

可以使用以下所示的“pip”命令安装它:

pip install scikit−learn

该库专注于数据建模。

可以使用“Pipeline”函数实现简化操作,该函数可以将特定维度的数组转换为不同维度的数组。

以下是一个示例:

示例

from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression
from sklearn.pipeline import Pipeline
import numpy as np
print("Creating object of the tool pipeline")
Stream_model = Pipeline([('poly', PolynomialFeatures(degree=3)), ('linear', LinearRegression(fit_intercept=False))])
x = np.arange(6)
print("The size of the original ndarray is")
print(x.shape)
y = 4 − 2 * x + x ** 2 - x ** 3.5
Stream_model = Stream_model.fit(x[:, np.newaxis], y)
print("Input polynomial coefficients are")
print(Stream_model.named_steps['linear'].coef_)

输出

Creating object of the tool pipeline
The size of the original ndarray is
(6,)
Input polynomial coefficients are
[ 4.31339202 −7.82933051 7.96372751 −3.39570215]

解释

  • 导入所需的包,并为方便使用赋予它们别名。

  • 使用“Pipeline”函数创建整个过程的管道。

  • 使用NumPy库生成数据点“x”和“y”的值。

  • 调用“LinearRegression”函数。

  • 生成的數據詳情將顯示在控制台上。

  • 使用“Pipeline”函数创建的模型适合数据。

  • 数据的线性系数将显示在控制台上。

更新于:2021年1月18日

132 次查看

启动您的职业生涯

通过完成课程获得认证

开始
广告