完整性评分#
- sklearn.metrics.completeness_score(labels_true, labels_pred)[source]#
计算给定真实标签的聚类标签的完整性度量。
如果给定类别的所有数据点都是同一个集群的元素,则聚类结果满足完整性。
此度量与标签的绝对值无关:类或集群标签值的排列不会以任何方式改变分数值。
此度量不是对称的:将
label_true
与label_pred
互换将返回homogeneity_score
,这通常是不同的。在用户指南中阅读更多信息。
- 参数:
- labels_true形状为 (n_samples,) 的类数组
用作参考的真实类标签。
- labels_pred形状为 (n_samples,) 的类数组
要评估的集群标签。
- 返回:
- completeness浮点数
0.0 到 1.0 之间的分数。1.0 代表完全完整的标签。
参考文献
示例
完美的标签是完整的
>>> from sklearn.metrics.cluster import completeness_score >>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0]) np.float64(1.0)
将所有类成员分配到同一聚类的非完美标签仍然是完整的
>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0])) 1.0 >>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1])) 0.999...
如果类成员分散在不同的聚类中,则该分配不能是完整的
>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1])) 0.0 >>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3])) 0.0
示例库#
scikit-learn 0.23 版本亮点
K-Means 聚类算法在手写数字数据上的演示
DBSCAN 聚类算法演示
亲和传播聚类算法演示
使用 k-means 聚类文本文档