一致性得分#
- sklearn.metrics.consensus_score(a, b, *, similarity='jaccard')[source]#
两组双聚类的相似性。
计算单个双聚类之间的相似性。然后,通过使用改进的 Jonker-Volgenant 算法求解线性总分配问题来找到集合之间的最佳匹配。最终得分是相似性之和除以较大集合的大小。
在 用户指南 中了解更多信息。
- 参数:
- a元组 (rows, columns)
一组双聚类的行和列指标元组。
- b元组 (rows, columns)
另一组类似于
a
的双聚类。- similarity‘jaccard’ 或可调用对象,默认为 ‘jaccard’
可以是字符串“jaccard”以使用 Jaccard 系数,或者任何接受四个参数的函数,每个参数都是一个一维指示向量:(a_rows, a_columns, b_rows, b_columns)。
- 返回值:
- consensus_score浮点数
一致性得分,一个非负值,由相似度之和除以较大集合的大小计算得出。
另见
scipy.optimize.linear_sum_assignment
求解线性求和分配问题。
参考文献
Hochreiter, Bodenhofer, et. al., 2010. FABIA:用于双聚类获取的因子分析.
示例
>>> from sklearn.metrics import consensus_score >>> a = ([[True, False], [False, True]], [[False, True], [True, False]]) >>> b = ([[False, True], [True, False]], [[True, False], [False, True]]) >>> consensus_score(a, b, similarity='jaccard') np.float64(1.0)