Rand指数#
- sklearn.metrics.rand_score(labels_true, labels_pred)[source]#
Rand指数。
Rand指数通过考虑所有样本对并计算在预测和真实聚类中被分配到相同或不同聚类的样本对的数量来计算两个聚类之间的相似性度量 [1] [2]。
原始RI分数 [3] 为
RI = (number of agreeing pairs) / (number of pairs)
更多信息请参见用户指南。
- 参数:
- labels_true形状为 (n_samples,) 的类数组,dtype=integral
用作参考的真实类标签。
- labels_pred形状为 (n_samples,) 的类数组,dtype=integral
要评估的聚类标签。
- 返回值:
- RI浮点数
相似度分数,介于 0.0 和 1.0 之间(包含 0.0 和 1.0),1.0 表示完美匹配。
另请参见
调整后的Rand指数
调整后的Rand指数。
调整后的互信息得分
调整后的互信息。
参考文献
示例
即使标签完全匹配,分数也是1
>>> from sklearn.metrics.cluster import rand_score >>> rand_score([0, 0, 1, 1], [1, 1, 0, 0]) 1.0
将所有类成员分配到同一集群的标签是完整的,但可能并不总是纯净的,因此会受到惩罚。
>>> rand_score([0, 0, 1, 2], [0, 0, 1, 1]) np.float64(0.83...)
图库示例#
聚类性能评估中的偶然性调整