contingency_matrix#

sklearn.metrics.cluster.contingency_matrix(labels_true, labels_pred, *, eps=None, sparse=False, dtype=<class 'numpy.int64'>)[源码]#

构建描述标签之间关系的列联矩阵。

在用户指南中阅读更多内容。

参数:

labels_true形状为 (n_samples,) 的类数组: 作为参考使用的真实类别标签。
labels_pred形状为 (n_samples,) 的类数组: 要评估的聚类标签。
eps浮点数，默认值=None: 如果为浮点数，则该值将添加到列联矩阵中的所有值。这有助于阻止 NaN 传播。如果为 None，则不进行调整。
sparse布尔值，默认值=False: 如果为 True，则返回稀疏 CSR 列联矩阵。如果 eps 不为 None 且 sparse 为 True，将引发 ValueError。

0.18 版本新增。
dtype数值类型，默认值=np.int64: 输出数据类型。如果 eps 不为 None，则忽略。

0.24 版本新增。

返回:

contingency{类数组，稀疏}，形状=[n_classes_true, n_classes_pred]: 矩阵 \(C\)，其中 \(C_{i, j}\) 是真实类别 \(i\) 和预测类别 \(j\) 中的样本数。如果 eps is None，除非通过 dtype 参数另行设置，否则此数组的数据类型将为整数。如果给定 eps，数据类型将为浮点数。如果 sparse=True，它将是 sklearn.sparse.csr_matrix。

示例

>>> from sklearn.metrics.cluster import contingency_matrix
>>> labels_true = [0, 0, 1, 1, 2, 2]
>>> labels_pred = [1, 0, 2, 1, 0, 2]
>>> contingency_matrix(labels_true, labels_pred)
array([[1, 1, 0],
       [0, 1, 1],
       [1, 0, 1]])

contingency_matrix#

本页