如何使用 Python Scikit-learn 生成随机回归问题?


Python Scikit-learn 提供了 `make_regression()` 函数,我们可以用它来生成随机回归问题。在本教程中,我们将学习如何生成随机回归问题和具有稀疏不相关设计的随机回归问题。

随机回归问题

要使用 Python Scikit-learn 生成随机回归问题,我们可以按照以下步骤操作:

步骤 1 - 导入执行程序所需的库 `sklearn.datasets.make_regression` 和 `matplotlib`。

步骤 2 - 提供样本数量和其他参数。

步骤 3 - 使用 matplotlib 库设置输出图形的大小和样式。

步骤 4 - 使用 matplotlib 绘制回归问题。

示例

在下面的示例中,我们将生成具有 500 个样本的回归问题。

# Importing libraries from sklearn.datasets import make_regression from matplotlib import pyplot as plt from matplotlib import style import seaborn as sns # Set the figure size plt.rcParams["figure.figsize"] = [7.50, 3.50] plt.rcParams["figure.autolayout"] = True # Creating and plotting the regression problem style.use("Solarize_Light2") r_data, r_values = make_regression(n_samples=500, n_features=1, n_informative=2, noise=1) plt.scatter(r_data[:,0],r_values,cmap='rocket'); plt.show()

输出

它将产生以下输出:


具有稀疏不相关设计的随机回归问题

Python Scikit-learn 提供了 `make_sparse_uncorrelated()` 函数,我们可以用它来生成具有不相关设计的随机回归问题。

为此,我们可以采取以下步骤:

步骤 1 - 导入执行程序所需的库 `sklearn.datasets.make_sparse_uncorrelated` 和 `matplotlib`。

步骤 2 - 提供样本数量和其他参数。

步骤 3 - 使用 matplotlib 库设置输出图形的大小和样式。

步骤 4 - 使用 matplotlib 绘制回归问题。

示例

在下面的示例中,我们将生成具有 500 个样本和 4 个特征的回归问题。`n_features` 参数的默认值为 10。

# Importing libraries from sklearn.datasets import make_sparse_uncorrelated from matplotlib import pyplot as plt from matplotlib import style # Set the figure size plt.rcParams["figure.figsize"] = [7.50, 3.50] plt.rcParams["figure.autolayout"] = True # Creating the regression problem with sparse uncorrelated design X, y = make_sparse_uncorrelated(n_samples=500, n_features=4) # Plotting the dataset style.use("Solarize_Light2") plt.figure(figsize=(7.50, 3.50)) plt.title("Random regression problem with sparse uncorrelated design", fontsize="12") plt.scatter(X[:,0],y,edgecolor="k"); plt.show()

输出

它将产生以下输出:


更新于:2022年10月4日

953 次浏览

开启你的职业生涯

完成课程获得认证

开始学习
广告