平均绝对百分比误差#

sklearn.metrics.mean_absolute_percentage_error(y_true, y_pred, *, sample_weight=None, multioutput='uniform_average')[source]#

平均绝对百分比误差 (MAPE) 回归损失。

注意，我们没有使用常见的“百分比”定义：将范围在 [0, 100] 的百分比通过除以 100 转换为范围在 [0, 1] 的相对值。因此，200% 的误差对应于 2 的相对误差。

更多信息请参见用户指南。

0.24 版本新增。

参数：

y_truearray-like of shape (n_samples,) or (n_samples, n_outputs)

真实目标值。

y_predarray-like of shape (n_samples,) or (n_samples, n_outputs)

预测目标值。

sample_weightarray-like of shape (n_samples,), default=None

样本权重。

multioutput{‘raw_values’, ‘uniform_average’} or array-like

定义多个输出值的聚合方式。数组状的值定义用于平均误差的权重。如果输入是列表，则形状必须为 (n_outputs, )。

‘raw_values’: 对于多输出输入，返回完整的误差集。
‘uniform_average’: 所有输出的误差以统一权重平均。

返回：

lossfloat or ndarray of floats

如果 multioutput 参数为 'raw_values'，则会分别返回每个输出的平均绝对百分比误差。如果 multioutput 参数为 'uniform_average' 或一个权重 ndarray，则会返回所有输出误差的加权平均值。

MAPE 输出为非负浮点数。最佳值为 0.0。但请注意，错误的预测会导致任意大的 MAPE 值，尤其是一些 y_true 值非常接近于零时。请注意，当 y_true 为零时，我们返回一个大值而不是 inf。

示例

>>> from sklearn.metrics import mean_absolute_percentage_error
>>> y_true = [3, -0.5, 2, 7]
>>> y_pred = [2.5, 0.0, 2, 8]
>>> mean_absolute_percentage_error(y_true, y_pred)
0.3273...
>>> y_true = [[0.5, 1], [-1, 1], [7, -6]]
>>> y_pred = [[0, 2], [-1, 2], [8, -5]]
>>> mean_absolute_percentage_error(y_true, y_pred)
0.5515...
>>> mean_absolute_percentage_error(y_true, y_pred, multioutput=[0.3, 0.7])
0.6198...
>>> # the value when some element of the y_true is zero is arbitrarily high because
>>> # of the division by epsilon
>>> y_true = [1., 0., 2.4, 7.]
>>> y_pred = [1.2, 0.1, 2.4, 8.]
>>> mean_absolute_percentage_error(y_true, y_pred)
112589990684262.48

图库示例#

时间序列预测的滞后特征