如何使用scikit-learn管道工具中的简化流程将输入数据数组转换为新的数据数组?
Scikit-learn,通常称为sklearn,是Python中用于实现机器学习算法的库。它是一个开源库,因此可以免费使用。
它功能强大且健壮,因为它提供了各种工具来执行统计建模。这包括分类、回归、聚类、降维等等,借助于Python中强大且稳定的接口。
该库基于NumPy、SciPy和Matplotlib库。
可以使用以下所示的“pip”命令安装它:
pip install scikit−learn
该库专注于数据建模。
可以使用“Pipeline”函数实现简化操作,该函数可以将特定维度的数组转换为不同维度的数组。
以下是一个示例:
示例
from sklearn.preprocessing import PolynomialFeatures from sklearn.linear_model import LinearRegression from sklearn.pipeline import Pipeline import numpy as np print("Creating object of the tool pipeline") Stream_model = Pipeline([('poly', PolynomialFeatures(degree=3)), ('linear', LinearRegression(fit_intercept=False))]) x = np.arange(6) print("The size of the original ndarray is") print(x.shape) y = 4 − 2 * x + x ** 2 - x ** 3.5 Stream_model = Stream_model.fit(x[:, np.newaxis], y) print("Input polynomial coefficients are") print(Stream_model.named_steps['linear'].coef_)
输出
Creating object of the tool pipeline The size of the original ndarray is (6,) Input polynomial coefficients are [ 4.31339202 −7.82933051 7.96372751 −3.39570215]
解释
导入所需的包,并为方便使用赋予它们别名。
使用“Pipeline”函数创建整个过程的管道。
使用NumPy库生成数据点“x”和“y”的值。
调用“LinearRegression”函数。
生成的數據詳情將顯示在控制台上。
使用“Pipeline”函数创建的模型适合数据。
数据的线性系数将显示在控制台上。
广告