make_checkerboard#
- sklearn.datasets.make_checkerboard(shape, n_clusters, *, noise=0.0, minval=10, maxval=100, shuffle=True, random_state=None)[源代码]#
生成一个具有块状棋盘格结构的数组,用于双聚类。
更多信息请参阅用户指南。
- 参数:
- shape形状为 (n_rows, n_cols) 的元组
结果的形状。
- n_clusters整数或类似数组,或形状为 (n_row_clusters, n_column_clusters) 的元组
行和列聚类的数量。
- noise浮点数, 默认为 0.0
高斯噪声的标准差。
- minval浮点数, 默认为 10
双聚类的最小值。
- maxval浮点数, 默认为 100
双聚类的最大值。
- shuffle布尔值, 默认为 True
打乱样本。
- random_state整数, RandomState 实例或 None, 默认为 None
确定数据集创建的随机数生成。传入一个整数可在多次函数调用中获得可重现的输出。请参阅术语表。
- 返回:
- X形状为
shape
的 ndarray 生成的数组。
- rows形状为 (n_clusters, X.shape[0]) 的 ndarray
每行的聚类成员指标。
- cols形状为 (n_clusters, X.shape[1]) 的 ndarray
每列的聚类成员指标。
- X形状为
另请参阅
make_biclusters
生成一个具有恒定块对角线结构的数组,用于双聚类。
参考文献
[1]Kluger, Y., Basri, R., Chang, J. T., & Gerstein, M. (2003). Spectral biclustering of microarray data: coclustering genes and conditions. Genome research, 13(4), 703-716.
示例
>>> from sklearn.datasets import make_checkerboard >>> data, rows, columns = make_checkerboard(shape=(300, 300), n_clusters=10, ... random_state=42) >>> data.shape (300, 300) >>> rows.shape (100, 300) >>> columns.shape (100, 300) >>> print(rows[0][:5], columns[0][:5]) [False False False True False] [False False False False False]