make_circles#

sklearn.datasets.make_circles(n_samples=100, *, shuffle=True, noise=None, random_state=None, factor=0.8)[source]#

在二维空间中生成一个包含较小圆的大圆。

一个简单的玩具数据集,用于可视化聚类和分类算法。

用户指南中阅读更多内容。

参数:
n_samplesint 或形状为 (2,) 的元组,类型为 int,默认值 100

如果为 int,则表示生成的总点数。对于奇数,内圆将比外圆多一个点。如果为二元组,则表示外圆和内圆中的点数。

0.23 版本中的变更: 添加了二元组。

shufflebool,默认值 True

是否打乱样本。

noisefloat,默认值 None

添加到数据的 Gaussian 噪声的标准差。

random_stateint,RandomState 实例或 None,默认值 None

确定数据集洗牌和噪声的随机数生成。传入一个 int 以便在多次函数调用中获得可重现的输出。请参阅术语表

factorfloat,默认值 .8

内圆和外圆之间的缩放因子,范围为 [0, 1)

返回:
X形状为 (n_samples, 2) 的 ndarray

生成的样本。

y形状为 (n_samples,) 的 ndarray

每个样本的类别成员资格的整数标签(0 或 1)。

示例

>>> from sklearn.datasets import make_circles
>>> X, y = make_circles(random_state=42)
>>> X.shape
(100, 2)
>>> y.shape
(100,)
>>> list(y[:5])
[np.int64(1), np.int64(1), np.int64(1), np.int64(0), np.int64(0)]