创建高斯分位数#
- sklearn.datasets.make_gaussian_quantiles(*, mean=None, cov=1.0, n_samples=100, n_features=2, n_classes=3, shuffle=True, random_state=None)[source]#
- 根据分位数生成各向同性高斯分布样本和标签。 - 这个分类数据集是通过采用多维标准正态分布,并用嵌套的同心多维球体定义类别来构建的,这样每个类别中的样本数量大致相等(\(\chi^2\) 分布的分位数)。 - 更多信息请阅读 用户指南。 - 参数:
- meanarray-like of shape (n_features,), default=None
- 多维正态分布的均值。如果为 None,则使用原点 (0, 0, …)。 
- covfloat, default=1.0
- 协方差矩阵将是该值乘以单位矩阵。此数据集仅生成对称正态分布。 
- n_samplesint, default=100
- 在各类别中平均分配的点数总数。 
- n_featuresint, default=2
- 每个样本的特征数。 
- n_classesint, default=3
- 类别数。 
- shufflebool, default=True
- 是否打乱样本。 
- random_stateint, RandomState instance or None, default=None
- 确定数据集创建的随机数生成。传递一个整数以在多次函数调用中获得可重复的输出。参见 术语表。 
 
- 返回:
- Xndarray of shape (n_samples, n_features)
- 生成的样本。 
- yndarray of shape (n_samples,)
- 每个样本分位数隶属关系的整数标签。 
 
 - 备注 - 该数据集来自 Zhu 等人 [1]。 - 参考文献 [1]- Zhu, H. Zou, S. Rosset, T. Hastie, “Multi-class AdaBoost”, 2009. 
 - 示例 - >>> from sklearn.datasets import make_gaussian_quantiles >>> X, y = make_gaussian_quantiles(random_state=42) >>> X.shape (100, 2) >>> y.shape (100,) >>> list(y[:5]) [np.int64(2), np.int64(0), np.int64(1), np.int64(0), np.int64(2)] 
 
     
