rand_score#

sklearn.metrics.rand_score(labels_true, labels_pred)[source]#

兰德指数。

兰德指数通过考虑所有样本对,并计算在预测聚类和真实聚类中分配到相同或不同簇的对的数量,来衡量两个聚类之间的相似度 [1] [2]

原始 RI 分数 [3]

RI = (number of agreeing pairs) / (number of pairs)

用户指南中了解更多。

参数:
labels_true形状为 (n_samples,) 且 dtype 为 integral 的类数组

用作参考的真实类别标签。

labels_pred形状为 (n_samples,) 且 dtype 为 integral 的类数组

要评估的聚类标签。

返回:
RI浮点数

相似度得分在 0.0 到 1.0 之间(含两端),1.0 表示完美匹配。

另请参阅

adjusted_rand_score

调整兰德指数。

adjusted_mutual_info_score

调整互信息。

参考文献

示例

完美匹配的标签方案得分为 1

>>> from sklearn.metrics.cluster import rand_score
>>> rand_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

将所有类别成员分配到相同簇的标签方案是完整的,但可能不总是纯净的,因此会受到惩罚

>>> rand_score([0, 0, 1, 2], [0, 0, 1, 1])
0.83