同质性得分#

sklearn.metrics.homogeneity_score(labels_true, labels_pred)[source]#

给定真值标签的聚类标签的同质性度量。

如果聚类结果的所有聚类只包含属于单个类别的数

此度量独立于标签的绝对值：类或聚类标签值的排列不会以任何方式改变得分值。

此度量不是对称的：交换label_true与label_pred将返回completeness_score，这通常是不同的。

在用户指南中阅读更多信息。

参数：

返回:

另请参阅

参考文献

[1]

示例

完美的标签是同质的

>>> from sklearn.metrics.cluster import homogeneity_score
>>> homogeneity_score([0, 0, 1, 1], [1, 1, 0, 0])
np.float64(1.0)

将类进一步拆分为更多聚类的非完美标签可以是完全同质的

>>> print("%.6f" % homogeneity_score([0, 0, 1, 1], [0, 0, 1, 2]))
1.000000
>>> print("%.6f" % homogeneity_score([0, 0, 1, 1], [0, 1, 2, 3]))
1.000000

包含来自不同类的样本的聚类不会构成同质标签

>>> print("%.6f" % homogeneity_score([0, 0, 1, 1], [0, 1, 0, 1]))
0.0...
>>> print("%.6f" % homogeneity_score([0, 0, 1, 1], [0, 0, 0, 0]))
0.0...

图库示例#