completeness_score#

sklearn.metrics.completeness_score(labels_true, labels_pred)[source]#

计算给定地面实况的聚类标签的完整性指标。

如果一个聚类结果满足完整性(completeness),那么属于同一给定类别的所有数据点都必须属于同一个簇。

此度量独立于标签的绝对值:类或簇标签值的排列不会以任何方式改变分数。

该指标不是对称的:将 label_truelabel_pred 互换将返回 homogeneity_score,其结果通常是不同的。

用户指南 中了解更多信息。

参数:
labels_true形状为 (n_samples,) 的类数组

用作参考的真实类别标签。

labels_pred形状为 (n_samples,) 的类数组

要评估的簇标签。

返回:
completenessfloat

分数介于0.0和1.0之间。1.0表示完全完整的标签。

另请参阅

homogeneity_score

聚类标签的同质性指标。

v_measure_score

V-Measure(具有算术平均选项的 NMI)。

References

示例

完美的标签分配是完整的。

>>> from sklearn.metrics.cluster import completeness_score
>>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

将所有类别成员分配给同一簇的非完美标签分配仍然是完整的。

>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0]))
1.0
>>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1]))
0.999

如果类别成员分散在不同的簇中,则该分配不完整。

>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1]))
0.0
>>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3]))
0.0