DummyRegressor#

class sklearn.dummy.DummyRegressor(*, strategy='mean', constant=None, quantile=None)[source]#

使用简单规则进行预测的回归器。

此回归器可用作与其他（真实）回归器进行比较的简单基线。请勿将其用于实际问题。

在用户指南中了解更多信息。

在 0.13 版本中新增。

参数:

strategy{“mean”, “median”, “quantile”, “constant”}，默认为“mean”

用于生成预测的策略。

“mean”：始终预测训练集的均值
“median”：始终预测训练集的中位数
“quantile”：始终预测训练集的指定分位数，通过 quantile 参数提供。
“constant”：始终预测用户提供的常数值。

constantint、float 或形状为 (n_outputs,) 的类数组，默认为 None

“constant”策略预测的显式常量。此参数仅对“constant”策略有用。

quantilefloat 类型，范围为 [0.0, 1.0]，默认为 None

使用“quantile”策略进行预测的分位数。0.5 分位数对应中位数，0.0 对应最小值，1.0 对应最大值。

属性:

constant_形状为 (1, n_outputs) 的 ndarray: 训练目标的均值、中位数、分位数或用户给定的常数值。
n_features_in_int: 在拟合期间所见特征的数量。
feature_names_in_形状为 (n_features_in_,) 的 ndarray: 在拟合期间所见的特征名称。仅当 X 的所有特征名称均为字符串时才定义。
n_outputs_int: 输出数量。

另请参阅

DummyClassifier: 使用简单规则进行预测的分类器。

示例

>>> import numpy as np
>>> from sklearn.dummy import DummyRegressor
>>> X = np.array([1.0, 2.0, 3.0, 4.0])
>>> y = np.array([2.0, 3.0, 5.0, 10.0])
>>> dummy_regr = DummyRegressor(strategy="mean")
>>> dummy_regr.fit(X, y)
DummyRegressor()
>>> dummy_regr.predict(X)
array([5., 5., 5., 5.])
>>> dummy_regr.score(X, y)
0.0

fit(X, y, sample_weight=None)[source]#

拟合基线回归器。

参数:

X形状为 (n_samples, n_features) 的类数组: 训练数据。
y形状为 (n_samples,) 或 (n_samples, n_outputs) 的类数组: 目标值。
sample_weight形状为 (n_samples,) 的类数组，默认为 None: 样本权重。

返回:

self对象: 已拟合的估计器。

get_metadata_routing()[source]#

获取此对象的元数据路由。

请查看用户指南，了解路由机制的工作原理。

返回:

routingMetadataRequest: 封装路由信息的MetadataRequest。

get_params(deep=True)[source]#

获取此估计器的参数。

参数:

deepbool 类型，默认为 True: 如果为 True，将返回此估计器以及包含的作为估计器的子对象的参数。

返回:

params字典: 参数名称与其值之间的映射。

predict(X, return_std=False)[source]#

对测试向量 X 执行预测。

参数:

X形状为 (n_samples, n_features) 的类数组: 测试数据。
return_stdbool 类型，默认为 False: 是否返回后验预测的标准差。在这种情况下，所有值为零。

在 0.20 版本中新增。

返回:

y形状为 (n_samples,) 或 (n_samples, n_outputs) 的类数组: X 的预测目标值。
y_std形状为 (n_samples,) 或 (n_samples, n_outputs) 的类数组: 查询点预测分布的标准差。

score(X, y, sample_weight=None)[source]#

返回预测的决定系数 R^2。

决定系数 R^2 定义为 (1 - u/v)，其中 u 是残差平方和 ((y_true - y_pred) ** 2).sum()，v 是总平方和 ((y_true - y_true.mean()) ** 2).sum()。最佳得分是 1.0，也可能为负（因为模型可能任意差）。一个始终预测 y 期望值而忽略输入特征的常数模型将得到 0.0 的 R^2 分数。

参数:

XNone 或形状为 (n_samples, n_features) 的类数组: 测试样本。将 None 作为测试样本传递与传递真实测试样本会得到相同的结果，因为 DummyRegressor 的操作独立于采样观测值。
y形状为 (n_samples,) 或 (n_samples, n_outputs) 的类数组: X 的真实值。
sample_weight形状为 (n_samples,) 的类数组，默认为 None: 样本权重。

返回:

scorefloat: self.predict(X) 相对于 y 的 R^2。

set_fit_request(*, sample_weight: bool | None | str = '$UNCHANGED$') → DummyRegressor[source]#

请求传递给 fit 方法的元数据。

请注意，此方法仅在 enable_metadata_routing=True 时才相关（参见 sklearn.set_config）。请参阅用户指南，了解路由机制的工作原理。

每个参数的选项有：

True：请求元数据，如果提供，则将其传递给 fit。如果未提供元数据，则忽略该请求。
False：不请求元数据，元估计器不会将其传递给 fit。
None：不请求元数据，如果用户提供，元估计器将引发错误。
str：元数据应以给定别名而非原始名称传递给元估计器。

默认值 (sklearn.utils.metadata_routing.UNCHANGED) 保留现有请求。这允许您更改某些参数的请求，而不更改其他参数的请求。

在 1.3 版本中新增。

注意

此方法仅在将此估计器用作元估计器的子估计器时（例如，在 Pipeline 内部使用时）才相关。否则，它没有效果。

参数:

sample_weightstr, True, False, 或 None，默认为 sklearn.utils.metadata_routing.UNCHANGED: fit 方法中 sample_weight 参数的元数据路由。

返回:

self对象: 更新后的对象。

set_params(**params)[source]#

设置此估计器的参数。

此方法适用于简单估计器以及嵌套对象（例如 Pipeline）。后者具有 <component>__<parameter> 形式的参数，以便可以更新嵌套对象的每个组件。

参数:

**params字典: 估计器参数。

返回:

self估计器实例: 估计器实例。

set_predict_request(*, return_std: bool | None | str = '$UNCHANGED$') → DummyRegressor[source]#

请求传递给 predict 方法的元数据。

请注意，此方法仅在 enable_metadata_routing=True 时才相关（参见 sklearn.set_config）。请参阅用户指南，了解路由机制的工作原理。

每个参数的选项有：

True：请求元数据，如果提供，则将其传递给 predict。如果未提供元数据，则忽略该请求。
False：不请求元数据，元估计器不会将其传递给 predict。
None：不请求元数据，如果用户提供，元估计器将引发错误。
str：元数据应以给定别名而非原始名称传递给元估计器。

默认值 (sklearn.utils.metadata_routing.UNCHANGED) 保留现有请求。这允许您更改某些参数的请求，而不更改其他参数的请求。

在 1.3 版本中新增。

注意

此方法仅在将此估计器用作元估计器的子估计器时（例如，在 Pipeline 内部使用时）才相关。否则，它没有效果。

参数:

return_stdstr, True, False, 或 None，默认为 sklearn.utils.metadata_routing.UNCHANGED: predict 方法中 return_std 参数的元数据路由。

返回:

self对象: 更新后的对象。

set_score_request(*, sample_weight: bool | None | str = '$UNCHANGED$') → DummyRegressor[source]#

请求传递给 score 方法的元数据。

请注意，此方法仅在 enable_metadata_routing=True 时才相关（参见 sklearn.set_config）。请参阅用户指南，了解路由机制的工作原理。

每个参数的选项有：

True：请求元数据，如果提供，则将其传递给 score。如果未提供元数据，则忽略该请求。
False：不请求元数据，元估计器不会将其传递给 score。
None：不请求元数据，如果用户提供，元估计器将引发错误。
str：元数据应以给定别名而非原始名称传递给元估计器。

默认值 (sklearn.utils.metadata_routing.UNCHANGED) 保留现有请求。这允许您更改某些参数的请求，而不更改其他参数的请求。

在 1.3 版本中新增。

注意

此方法仅在将此估计器用作元估计器的子估计器时（例如，在 Pipeline 内部使用时）才相关。否则，它没有效果。

参数:

sample_weightstr, True, False, 或 None，默认为 sklearn.utils.metadata_routing.UNCHANGED: score 方法中 sample_weight 参数的元数据路由。

返回:

self对象: 更新后的对象。

图库示例#

泊松回归和非正态损失

保险理赔的 Tweedie 回归

DummyRegressor#

图库示例#

本页