make_circles#

sklearn.datasets.make_circles(n_samples=100, *, shuffle=True, noise=None, random_state=None, factor=0.8)[source]#

在 2d 中创建一个包含较小圆圈的大圆圈。

一个简单的玩具数据集,用于可视化聚类和分类算法。

用户指南中阅读更多内容。

参数:
n_samplesint or tuple of shape (2,), dtype=int, default=100

如果为 int,则为生成的点的总数。对于奇数,内圈将比外圈多一个点。如果为包含两个元素的元组,则分别为外圈和内圈中的点数。

版本 0.23 中的新功能: 添加了两个元素的元组。

shufflebool, default=True

是否打乱样本。

noisefloat, default=None

添加到数据的 Gaussian 噪声的标准差。

random_stateint, RandomState instance or None, default=None

确定数据集打乱和噪声的随机数生成。传入一个 int 以在多次函数调用中获得可重现的输出。请参阅 Glossary

factorfloat, default=.8

内圈和外圈之间的比例因子,范围为 [0, 1)

返回:
Xndarray of shape (n_samples, 2)

生成的样本。

yndarray of shape (n_samples,)

每个样本的类别成员资格的整数标签(0 或 1)。

示例

>>> from sklearn.datasets import make_circles
>>> X, y = make_circles(random_state=42)
>>> X.shape
(100, 2)
>>> y.shape
(100,)
>>> list(y[:5])
[np.int64(1), np.int64(1), np.int64(1), np.int64(0), np.int64(0)]