完整性评分#

sklearn.metrics.completeness_score(labels_true, labels_pred)[source]#

计算给定真实标签的聚类标签的完整性度量。

如果给定类别的所有数据点都是同一个集群的元素,则聚类结果满足完整性。

此度量与标签的绝对值无关:类或集群标签值的排列不会以任何方式改变分数值。

此度量不是对称的:将label_truelabel_pred互换将返回homogeneity_score,这通常是不同的。

用户指南中阅读更多信息。

参数:
labels_true形状为 (n_samples,) 的类数组

用作参考的真实类标签。

labels_pred形状为 (n_samples,) 的类数组

要评估的集群标签。

返回:
completeness浮点数

0.0 到 1.0 之间的分数。1.0 代表完全完整的标签。

另请参阅

同质性评分

聚类标签的同质性度量。

V量度评分

V-Measure(使用算术平均值的NMI)。

参考文献

示例

完美的标签是完整的

>>> from sklearn.metrics.cluster import completeness_score
>>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0])
np.float64(1.0)

将所有类成员分配到同一聚类的非完美标签仍然是完整的

>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0]))
1.0
>>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1]))
0.999...

如果类成员分散在不同的聚类中,则该分配不能是完整的

>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1]))
0.0
>>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3]))
0.0