coverage_error#

sklearn.metrics.coverage_error(y_true, y_score, *, sample_weight=None)[source]#

覆盖误差度量。

计算在排名的得分中需要遍历多远才能覆盖所有真实标签。最佳值等于每个样本中 y_true 的平均标签数量。

y_scores 中的平局通过赋予所有平局值可能被分配的最大排名来解决。

注意：我们实现的分数比 Tsoumakas 等人于 2010 年给出的分数大 1。这将其扩展为处理实例具有 0 个真实标签的退化情况。

在用户指南中了解更多。

参数:

y_true形如 (n_samples, n_labels) 的类数组: 以二元指示符格式表示的真实二元标签。
y_score形如 (n_samples, n_labels) 的类数组: 目标得分，可以是正类的概率估计、置信值，或未经过阈值处理的决策度量（某些分类器上的 “decision_function” 返回的值）。对于 decision_function 分数，大于或等于零的值应表示正类。
sample_weight形如 (n_samples,) 的类数组，默认为 None: 样本权重。

返回:

coverage_error浮点数: 覆盖误差。

参考文献

[1]

Tsoumakas, G., Katakis, I., & Vlahavas, I. (2010). 多标签数据挖掘。载于：数据挖掘与知识发现手册（第 667-685 页）。美国施普林格出版社。

示例

>>> from sklearn.metrics import coverage_error
>>> y_true = [[1, 0, 0], [0, 1, 1]]
>>> y_score = [[1, 0, 0], [0, 1, 1]]
>>> coverage_error(y_true, y_score)
1.5

coverage_error#

本页