completeness_score#
- sklearn.metrics.completeness_score(labels_true, labels_pred)[source]#
计算给定地面实况的聚类标签的完整性指标。
如果一个聚类结果满足完整性(completeness),那么属于同一给定类别的所有数据点都必须属于同一个簇。
此度量独立于标签的绝对值:类或簇标签值的排列不会以任何方式改变分数。
该指标不是对称的:将
label_true与label_pred互换将返回homogeneity_score,其结果通常是不同的。在 用户指南 中了解更多信息。
- 参数:
- labels_true形状为 (n_samples,) 的类数组
用作参考的真实类别标签。
- labels_pred形状为 (n_samples,) 的类数组
要评估的簇标签。
- 返回:
- completenessfloat
分数介于0.0和1.0之间。1.0表示完全完整的标签。
另请参阅
homogeneity_score聚类标签的同质性指标。
v_measure_scoreV-Measure(具有算术平均选项的 NMI)。
References
示例
完美的标签分配是完整的。
>>> from sklearn.metrics.cluster import completeness_score >>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0]) 1.0
将所有类别成员分配给同一簇的非完美标签分配仍然是完整的。
>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0])) 1.0 >>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1])) 0.999
如果类别成员分散在不同的簇中,则该分配不完整。
>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1])) 0.0 >>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3])) 0.0