consensus_score#
- sklearn.metrics.consensus_score(a, b, *, similarity='jaccard')[source]#
两组双聚类之间的相似性。
计算单个双聚类之间的相似性。然后,通过使用修改后的Jonker-Volgenant算法解决线性分配问题,找到集合之间的最佳匹配。最终分数是相似性之和除以较大集合的大小。
在用户指南中阅读更多。
- 参数:
- a元组 (行, 列)
一组双聚类的行和列指示符元组。
- b元组 (行, 列)
另一组双聚类,类似于
a
。- similarity‘jaccard’ 或可调用对象,默认值为 ‘jaccard’
可以是字符串“jaccard”以使用Jaccard系数,或任何接受四个参数(每个参数都是1维指示向量:(a_rows, a_columns, b_rows, b_columns))的函数。
- 返回:
- consensus_score浮点数
共识分数,一个非负值,是相似性之和除以较大集合的大小。
另请参见
scipy.optimize.linear_sum_assignment
解决线性分配问题。
参考文献
Hochreiter, Bodenhofer 等,2010年。FABIA: 用于双聚类获取的因子分析。
示例
>>> from sklearn.metrics import consensus_score >>> a = ([[True, False], [False, True]], [[False, True], [True, False]]) >>> b = ([[False, True], [True, False]], [[True, False], [False, True]]) >>> consensus_score(a, b, similarity='jaccard') 1.0