马修斯相关系数#

sklearn.metrics.matthews_corrcoef(y_true, y_pred, *, sample_weight=None)[source]#

计算马修斯相关系数 (MCC)。

马修斯相关系数在机器学习中用作二元和多类别分类质量的度量。它考虑了真阳性、假阳性、真阴性和假阴性,通常被认为是一个平衡的度量,即使类别大小差异很大也可以使用。MCC 本质上是一个介于 -1 和 +1 之间的相关系数。+1 系数表示完美的预测,0 表示平均随机预测,-1 表示反向预测。该统计量也称为 phi 系数。[来源:维基百科]

支持二元和多类别标签。只有在二元情况下,这才能与有关真阳性、假阳性、真阴性和假阴性的信息相关。请参见下面的参考文献。

用户指南 中了解更多信息。

参数:
y_true形状为 (n_samples,) 的类数组

地面实况(正确)目标值。

y_pred形状为 (n_samples,) 的类数组

分类器返回的估计目标。

sample_weight形状为 (n_samples,) 的类数组,默认为 None

样本权重。

在 0.18 版本中添加。

返回值:
mcc浮点数

马修斯相关系数(+1 代表完美预测,0 代表平均随机预测,-1 代表反向预测)。

参考文献

示例

>>> from sklearn.metrics import matthews_corrcoef
>>> y_true = [+1, +1, +1, -1]
>>> y_pred = [+1, -1, +1, +1]
>>> matthews_corrcoef(y_true, y_pred)
np.float64(-0.33...)