Python - 使用 Sklearn 创建测试数据集
Sklearn python 库提供的示例数据集可用于创建各种图形图。这些数据集的用处在于创建示例图形和图表以及预测图形的变化行为。在使用实际数据集之前,你还可以处理其他参数,比如决定此类示例图形的颜色和坐标轴等。
使用 make_blobs
在下面示例中,我们将 sklearn 库与 matplotlib 结合起来,以特定样式创建散点图。我们选择 200 个数据点的样本,并选择颜色和簇类型。
示例
from sklearn.datasets import make_blobs from matplotlib import pyplot as plt from matplotlib import style style.use("fast") X, y = make_blobs(n_samples=200, centers=, cluster_std=1, n_features=2) plt.scatter(X[:, 0], X[:, 1], s=60, color='r') plt.xlabel("X") plt.ylabel("Y") plt.show() plt.clf()
输出
运行上述代码,将得到以下结果 −
使用 make_circles
与上述方法类似,我们采用 make_circles 函数,以样本大小 100 和蓝色作为颜色创建圆圈。
示例
from sklearn.datasets import make_circles from matplotlib import pyplot as plt from matplotlib import style style.use("fast") X, y = make_circles(n_samples=100, noise=0.04) plt.scatter(X[:, 0], X[:, 1], s=40, color='b') plt.xlabel("X") plt.ylabel("Y") plt.show() plt.clf()
输出
运行上述代码,将得到以下结果 −
广告