rand_score#
- sklearn.metrics.rand_score(labels_true, labels_pred)[source]#
兰德指数。
兰德指数通过考虑所有样本对,并计算在预测聚类和真实聚类中分配到相同或不同簇的对的数量,来衡量两个聚类之间的相似度 [1] [2]。
原始 RI 分数 [3] 为
RI = (number of agreeing pairs) / (number of pairs)
在用户指南中了解更多。
- 参数:
- labels_true形状为 (n_samples,) 且 dtype 为 integral 的类数组
用作参考的真实类别标签。
- labels_pred形状为 (n_samples,) 且 dtype 为 integral 的类数组
要评估的聚类标签。
- 返回:
- RI浮点数
相似度得分在 0.0 到 1.0 之间(含两端),1.0 表示完美匹配。
另请参阅
adjusted_rand_score
调整兰德指数。
adjusted_mutual_info_score
调整互信息。
参考文献
[3]示例
完美匹配的标签方案得分为 1
>>> from sklearn.metrics.cluster import rand_score >>> rand_score([0, 0, 1, 1], [1, 1, 0, 0]) 1.0
将所有类别成员分配到相同簇的标签方案是完整的,但可能不总是纯净的,因此会受到惩罚
>>> rand_score([0, 0, 1, 2], [0, 0, 1, 1]) 0.83