生成双聚类#

sklearn.datasets.make_biclusters(shape, n_clusters, *, noise=0.0, minval=10, maxval=100, shuffle=True, random_state=None)[source]#

为双聚类生成一个常数块对角结构数组。

更多信息请参见用户指南。

参数:

shape形状为 (n_rows, n_cols) 的元组: 结果的形状。
n_clustersint: 双聚类的数量。
noise浮点数，默认为 0.0: 高斯噪声的标准差。
minval浮点数，默认为 10: 双聚类的最小值。
maxval浮点数，默认为 100: 双聚类的最大值。
shuffle布尔值，默认为 True: 是否打乱样本。
random_stateint、RandomState 实例或 None，默认为 None: 确定数据集创建的随机数生成。传递一个整数以在多次函数调用中获得可重复的输出。参见词汇表。

返回:

X形状为 shape 的 ndarray: 生成的数组。
rows形状为 (n_clusters, X.shape[0]) 的 ndarray: 每行的聚类成员指示符。
cols形状为 (n_clusters, X.shape[1]) 的 ndarray: 每列的聚类成员指示符。

另请参见

make_checkerboard: 生成具有双聚类块棋盘结构的数组。

参考文献

[1]

Dhillon, I. S. (2001, August). Co-clustering documents and words using bipartite spectral graph partitioning. In Proceedings of the seventh ACM SIGKDD international conference on Knowledge discovery and data mining (pp. 269-274). ACM.

示例

>>> from sklearn.datasets import make_biclusters
>>> data, rows, cols = make_biclusters(
...     shape=(10, 20), n_clusters=2, random_state=42
... )
>>> data.shape
(10, 20)
>>> rows.shape
(2, 10)
>>> cols.shape
(2, 20)

图库示例#

光谱共聚类算法的演示