rand_score#

sklearn.metrics.rand_score(labels_true, labels_pred)[source]#

Rand index。

Rand 指数通过考虑所有样本对,并计算在预测聚类和真实聚类中被分配到相同或不同簇的样本对数量,来衡量两个聚类之间的相似度 [1] [2]

原始 RI 分数 [3]

RI = (number of agreeing pairs) / (number of pairs)

用户指南 中阅读更多内容。

参数:
labels_true形状为 (n_samples,) 的类数组对象,dtype=integral

用作参考的真实类别标签。

labels_pred形状为 (n_samples,) 的类数组对象,dtype=integral

要评估的簇标签。

返回:
RIfloat

介于 0.0 和 1.0 之间的相似度分数(包含 0.0 和 1.0),其中 1.0 表示完美匹配。

另请参阅

adjusted_rand_score

调整兰德指数。

adjusted_mutual_info_score

调整互信息(Adjusted Mutual Information)。

References

示例

完美匹配的标签具有 1 分,即使

>>> from sklearn.metrics.cluster import rand_score
>>> rand_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

将所有类别成员分配到同一簇的标签是完整的,但可能并不总是纯净的,因此会受到惩罚

>>> rand_score([0, 0, 1, 2], [0, 0, 1, 1])
0.83