rand_score#
- sklearn.metrics.rand_score(labels_true, labels_pred)[source]#
Rand index。
Rand 指数通过考虑所有样本对,并计算在预测聚类和真实聚类中被分配到相同或不同簇的样本对数量,来衡量两个聚类之间的相似度 [1] [2]。
原始 RI 分数 [3] 为
RI = (number of agreeing pairs) / (number of pairs)
在 用户指南 中阅读更多内容。
- 参数:
- labels_true形状为 (n_samples,) 的类数组对象,dtype=integral
用作参考的真实类别标签。
- labels_pred形状为 (n_samples,) 的类数组对象,dtype=integral
要评估的簇标签。
- 返回:
- RIfloat
介于 0.0 和 1.0 之间的相似度分数(包含 0.0 和 1.0),其中 1.0 表示完美匹配。
另请参阅
adjusted_rand_score调整兰德指数。
adjusted_mutual_info_score调整互信息(Adjusted Mutual Information)。
References
[2]示例
完美匹配的标签具有 1 分,即使
>>> from sklearn.metrics.cluster import rand_score >>> rand_score([0, 0, 1, 1], [1, 1, 0, 0]) 1.0
将所有类别成员分配到同一簇的标签是完整的,但可能并不总是纯净的,因此会受到惩罚
>>> rand_score([0, 0, 1, 2], [0, 0, 1, 1]) 0.83