consensus_score#
- sklearn.metrics.consensus_score(a, b, *, similarity='jaccard')[source]#
两组双聚类的相似性。
计算单个双聚类之间的相似度。然后通过解决线性求和分配问题,使用修改后的 Jonker-Volgenant 算法找到集合之间的最佳匹配。最终分数是相似度之和除以较大集合的大小。
在用户指南中了解更多信息。
- 参数:
- atuple (rows, columns)
一组双聚类的行和列指示符元组。
- btuple (rows, columns)
另一组与
a类似的双聚类。- similarity‘jaccard’ or callable, default=’jaccard’
可以是字符串“jaccard”以使用 Jaccard 系数,也可以是接受四个参数(每个参数都是一个 1d 指示向量:(a_rows, a_columns, b_rows, b_columns))的任何函数。
- 返回:
- consensus_scorefloat
共识分数,一个非负值,即相似度之和除以较大集合的大小。
另请参阅
scipy.optimize.linear_sum_assignment解决线性求和分配问题。
References
Hochreiter, Bodenhofer, et. al., 2010. FABIA: factor analysis for bicluster acquisition。
示例
>>> from sklearn.metrics import consensus_score >>> a = ([[True, False], [False, True]], [[False, True], [True, False]]) >>> b = ([[False, True], [True, False]], [[True, False], [False, True]]) >>> consensus_score(a, b, similarity='jaccard') 1.0