列联表#
- sklearn.metrics.cluster.contingency_matrix(labels_true, labels_pred, *, eps=None, sparse=False, dtype=<class 'numpy.int64'>)[source]#
构建一个列联表,描述标签之间的关系。
- 参数:
- labels_truearray-like of shape (n_samples,)
用作参考的真实类标签。
- labels_predarray-like of shape (n_samples,)
要评估的聚类标签。
- epsfloat, default=None
如果为浮点数,则将其添加到列联表中的所有值。这有助于阻止 NaN 传播。如果为
None
,则不进行任何调整。- sparsebool, default=False
如果
True
,则返回一个稀疏的 CSR 混淆矩阵。如果eps
不是None
且sparse
为True
,则会引发 ValueError。版本 0.18 中添加。
- dtype数值类型,默认=np.int64
输出 dtype。如果
eps
不是None
,则忽略。版本 0.24 中添加。
- 返回:
- contingency{数组类,稀疏},形状=[n_classes_true, n_classes_pred]
矩阵 \(C\),使得 \(C_{i, j}\) 是真实类别 \(i\) 和预测类别 \(j\) 中样本的数量。如果
eps is None
,除非使用dtype
参数另行设置,否则该数组的 dtype 将为整数类型。如果给定eps
,则 dtype 将为浮点型。如果sparse=True
,则将为sklearn.sparse.csr_matrix
。
示例
>>> from sklearn.metrics.cluster import contingency_matrix >>> labels_true = [0, 0, 1, 1, 2, 2] >>> labels_pred = [1, 0, 2, 1, 0, 2] >>> contingency_matrix(labels_true, labels_pred) array([[1, 1, 0], [0, 1, 1], [1, 0, 1]])