Python - 使用 Sklearn 创建测试数据集


Sklearn python 库提供的示例数据集可用于创建各种图形图。这些数据集的用处在于创建示例图形和图表以及预测图形的变化行为。在使用实际数据集之前,你还可以处理其他参数,比如决定此类示例图形的颜色和坐标轴等。

使用 make_blobs

在下面示例中,我们将 sklearn 库与 matplotlib 结合起来,以特定样式创建散点图。我们选择 200 个数据点的样本,并选择颜色和簇类型。

示例

from sklearn.datasets import make_blobs
from matplotlib import pyplot as plt
from matplotlib import style
style.use("fast")
X, y = make_blobs(n_samples=200, centers=,
                  cluster_std=1, n_features=2)

plt.scatter(X[:, 0], X[:, 1], s=60, color='r')
plt.xlabel("X")
plt.ylabel("Y")
plt.show()
plt.clf()

输出

运行上述代码,将得到以下结果 −

使用 make_circles

与上述方法类似,我们采用 make_circles 函数,以样本大小 100 和蓝色作为颜色创建圆圈。

示例

from sklearn.datasets import make_circles
from matplotlib import pyplot as plt
from matplotlib import style
style.use("fast")
X, y = make_circles(n_samples=100, noise=0.04)
plt.scatter(X[:, 0], X[:, 1], s=40, color='b')
plt.xlabel("X")
plt.ylabel("Y")
plt.show()
plt.clf()

输出

运行上述代码,将得到以下结果 −

更新于: 2021 年 1 月 25 日

292 次查看

开启您的职业生涯

通过完成课程获得认证

开始
广告