创建棋盘格#
- sklearn.datasets.make_checkerboard(shape, n_clusters, *, noise=0.0, minval=10, maxval=100, shuffle=True, random_state=None)[source]#
- 生成具有块状棋盘结构的数组,用于双聚类。 - 在用户指南中了解更多信息。 - 参数:
- shape形状 (n_rows, n_cols) 的元组
- 结果的形状。 
- n_clusters整数或数组类或形状 (n_row_clusters, n_column_clusters)
- 行和列簇的数量。 
- noise浮点数,默认为 0.0
- 高斯噪声的标准差。 
- minval浮点数,默认为 10
- 双聚类的最小值。 
- maxval浮点数,默认为 100
- 双聚类的最大值。 
- shuffle布尔值,默认为 True
- 是否打乱样本。 
- random_state整数、RandomState 实例或 None,默认为 None
- 确定数据集创建的随机数生成。传递一个整数以在多次函数调用中获得可重复的输出。参见 术语表。 
 
- 返回:
- X形状为 shape的 ndarray
- 生成的数组。 
- rows形状为 (n_clusters, X.shape[0]) 的 ndarray
- 每行的聚类成员指示符。 
- cols形状为 (n_clusters, X.shape[1]) 的 ndarray
- 每列的聚类成员指示符。 
 
- X形状为 
 - 另请参见 - make_biclusters
- 生成一个具有常数块对角结构的用于双聚类的数组。 
 - 参考文献 [1]- Kluger, Y., Basri, R., Chang, J. T., & Gerstein, M. (2003). Spectral biclustering of microarray data: coclustering genes and conditions. Genome research, 13(4), 703-716. - 示例 - >>> from sklearn.datasets import make_checkerboard >>> data, rows, columns = make_checkerboard(shape=(300, 300), n_clusters=10, ... random_state=42) >>> data.shape (300, 300) >>> rows.shape (100, 300) >>> columns.shape (100, 300) >>> print(rows[0][:5], columns[0][:5]) [False False False True False] [False False False False False] 
 
    