completeness_score#

sklearn.metrics.completeness_score(labels_true, labels_pred)[源代码]#

计算给定真实标签的聚类结果的完备性度量。

如果给定类别中的所有数据点都属于同一个簇,则聚类结果满足完备性。

该度量独立于标签的绝对值:类别或簇标签值的任何排列都不会改变分数。

此度量不是对称的:将 label_truelabel_pred 互换将返回 homogeneity_score,这通常是不同的。

用户指南中了解更多信息。

参数:
labels_true形状为 (n_samples,) 的类数组对象

用作参考的真实类别标签。

labels_pred形状为 (n_samples,) 的类数组对象

要评估的簇标签。

返回:
completeness浮点数

分数介于 0.0 和 1.0 之间。1.0 表示完美的完备性标签。

另请参阅

homogeneity_score

聚类标签的同质性度量。

v_measure_score

V-Measure(带有算术平均选项的 NMI)。

参考文献

示例

完美的标签是完备的

>>> from sklearn.metrics.cluster import completeness_score
>>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

将所有类别成员分配到同一簇的非完美标签仍然是完备的

>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0]))
1.0
>>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1]))
0.999

如果类别成员分散到不同的簇中,则分配不是完备的

>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1]))
0.0
>>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3]))
0.0