make_checkerboard#

sklearn.datasets.make_checkerboard(shape, n_clusters, *, noise=0.0, minval=10, maxval=100, shuffle=True, random_state=None)[源代码]#

生成一个具有块状棋盘格结构的数组，用于双聚类。

更多信息请参阅用户指南。

参数:

shape形状为 (n_rows, n_cols) 的元组: 结果的形状。
n_clusters整数或类似数组，或形状为 (n_row_clusters, n_column_clusters) 的元组: 行和列聚类的数量。
noise浮点数, 默认为 0.0: 高斯噪声的标准差。
minval浮点数, 默认为 10: 双聚类的最小值。
maxval浮点数, 默认为 100: 双聚类的最大值。
shuffle布尔值, 默认为 True: 打乱样本。
random_state整数, RandomState 实例或 None, 默认为 None: 确定数据集创建的随机数生成。传入一个整数可在多次函数调用中获得可重现的输出。请参阅术语表。

返回:

X形状为 shape 的 ndarray: 生成的数组。
rows形状为 (n_clusters, X.shape[0]) 的 ndarray: 每行的聚类成员指标。
cols形状为 (n_clusters, X.shape[1]) 的 ndarray: 每列的聚类成员指标。

另请参阅

make_biclusters: 生成一个具有恒定块对角线结构的数组，用于双聚类。

参考文献

[1]

Kluger, Y., Basri, R., Chang, J. T., & Gerstein, M. (2003). Spectral biclustering of microarray data: coclustering genes and conditions. Genome research, 13(4), 703-716.

示例

>>> from sklearn.datasets import make_checkerboard
>>> data, rows, columns = make_checkerboard(shape=(300, 300), n_clusters=10,
...                                         random_state=42)
>>> data.shape
(300, 300)
>>> rows.shape
(100, 300)
>>> columns.shape
(100, 300)
>>> print(rows[0][:5], columns[0][:5])
[False False False  True False] [False False False False False]

画廊示例#

谱双聚类算法演示

make_checkerboard#

画廊示例#

当前页面