make_circles#
- sklearn.datasets.make_circles(n_samples=100, *, shuffle=True, noise=None, random_state=None, factor=0.8)[source]#
在 2d 中创建一个包含较小圆圈的大圆圈。
一个简单的玩具数据集,用于可视化聚类和分类算法。
在用户指南中阅读更多内容。
- 参数:
- n_samplesint or tuple of shape (2,), dtype=int, default=100
如果为 int,则为生成的点的总数。对于奇数,内圈将比外圈多一个点。如果为包含两个元素的元组,则分别为外圈和内圈中的点数。
版本 0.23 中的新功能: 添加了两个元素的元组。
- shufflebool, default=True
是否打乱样本。
- noisefloat, default=None
添加到数据的 Gaussian 噪声的标准差。
- random_stateint, RandomState instance or None, default=None
确定数据集打乱和噪声的随机数生成。传入一个 int 以在多次函数调用中获得可重现的输出。请参阅 Glossary。
- factorfloat, default=.8
内圈和外圈之间的比例因子,范围为
[0, 1)。
- 返回:
- Xndarray of shape (n_samples, 2)
生成的样本。
- yndarray of shape (n_samples,)
每个样本的类别成员资格的整数标签(0 或 1)。
示例
>>> from sklearn.datasets import make_circles >>> X, y = make_circles(random_state=42) >>> X.shape (100, 2) >>> y.shape (100,) >>> list(y[:5]) [np.int64(1), np.int64(1), np.int64(1), np.int64(0), np.int64(0)]