虚拟回归器#

class sklearn.dummy.DummyRegressor(*, strategy='mean', constant=None, quantile=None)[source]#

使用简单规则进行预测的回归器。

此回归器可用作与其他(真实)回归器进行比较的简单基线。请勿将其用于实际问题。

用户指南 中了解更多信息。

0.13 版本中新增。

参数:
strategy{“mean”, “median”, “quantile”, “constant”}, default=”mean”

用于生成预测的策略。

  • “mean”: 始终预测训练集的均值

  • “median”: 始终预测训练集的中位数

  • “quantile”: 始终预测训练集的指定分位数,由 quantile 参数提供。

  • “constant”: 始终预测用户提供的常数值。

constantint 或 float 或 array-like,shape 为 (n_outputs,),default=None

由“constant”策略预测的显式常数。此参数仅对“constant”策略有用。

quantile[0.0, 1.0] 中的 float,default=None

使用“quantile”策略预测的分位数。0.5 的分位数对应于中位数,而 0.0 对应于最小值,1.0 对应于最大值。

属性:
constant_shape 为 (1, n_outputs) 的 ndarray

训练目标的均值或中位数或分位数,或用户提供的常数值。

n_features_in_int

拟合过程中看到的特征数量。

feature_names_in_shape 为 (n_features_in_,) 的 ndarray

拟合过程中看到的特征名称。仅当 X 的特征名称全部为字符串时定义。

n_outputs_int

输出数量。

另请参见

DummyClassifier

使用简单规则进行预测的分类器。

示例

>>> import numpy as np
>>> from sklearn.dummy import DummyRegressor
>>> X = np.array([1.0, 2.0, 3.0, 4.0])
>>> y = np.array([2.0, 3.0, 5.0, 10.0])
>>> dummy_regr = DummyRegressor(strategy="mean")
>>> dummy_regr.fit(X, y)
DummyRegressor()
>>> dummy_regr.predict(X)
array([5., 5., 5., 5.])
>>> dummy_regr.score(X, y)
0.0
fit(X, y, sample_weight=None)[source]#

拟合基线回归器。

参数:
Xshape 为 (n_samples, n_features) 的 array-like

训练数据。

yshape 为 (n_samples,) 或 (n_samples, n_outputs) 的 array-like

目标值。

sample_weightshape 为 (n_samples,) 的 array-like,default=None

样本权重。

返回:
selfobject

拟合后的估计器。

get_metadata_routing()[source]#

获取此对象的元数据路由。

请查看 用户指南,了解路由机制的工作原理。

返回:
routingMetadataRequest

一个 MetadataRequest,封装了路由信息。

get_params(deep=True)[source]#

获取此估计器的参数。

参数:
deepbool,default=True

如果为 True,则将返回此估计器和包含的作为估计器的子对象的参数。

返回:
paramsdict

参数名称与其值的映射。

predict(X, return_std=False)[source]#

对测试向量 X 执行回归。

参数:
Xshape 为 (n_samples, n_features) 的 array-like

测试数据。

return_stdbool,default=False

是否返回后验预测的标准差。在这种情况下为全零。

0.20 版本中新增。

返回:
yshape 为 (n_samples,) 或 (n_samples, n_outputs) 的 array-like

X 的预测目标值。

y_stdshape 为 (n_samples,) 或 (n_samples, n_outputs) 的 array-like

查询点的预测分布的标准差。

score(X, y, sample_weight=None)[source]#

返回预测的决定系数 R^2。

系数 R^2 定义为 (1 - u/v),其中 u 是残差平方和 ((y_true - y_pred) ** 2).sum(),而 v 是总平方和 ((y_true - y_true.mean()) ** 2).sum()。最佳分数为 1.0,但也可能为负数(因为模型可以任意差)。一个始终预测 y 的期望值而不考虑输入特征的常数模型,其 R^2 分数为 0.0。

参数:
XNone 或 shape 为 (n_samples, n_features) 的数组

测试样本。将 None 作为测试样本传递与传递真实的测试样本得到的结果相同,因为 DummyRegressor 的运行独立于采样的观测值。

yshape 为 (n_samples,) 或 (n_samples, n_outputs) 的 array-like

X 的真实值。

sample_weightshape 为 (n_samples,) 的 array-like,default=None

样本权重。

返回:
score浮点数

self.predict(X) 相对于 y 的 R^2。

set_fit_request(*, sample_weight: bool | None | str = '$UNCHANGED$') DummyRegressor[source]#

传递给 fit 方法的请求元数据。

请注意,只有在 enable_metadata_routing=True 时(参见 sklearn.set_config)此方法才相关。请参见 用户指南,了解路由机制的工作原理。

每个参数的选项为

  • True:请求元数据,如果提供则传递给 fit。如果未提供元数据,则忽略请求。

  • False:不请求元数据,元估计器不会将其传递给 fit

  • None:不请求元数据,如果用户提供元数据,元估计器将引发错误。

  • str:元数据应使用此给定的别名而不是原始名称传递给元估计器。

默认值(sklearn.utils.metadata_routing.UNCHANGED)保留现有的请求。这允许您更改某些参数的请求而不更改其他参数的请求。

版本 1.3 中添加。

注意

仅当将此估计器用作元估计器的子估计器时(例如,在 Pipeline 中使用)此方法才相关。否则,它无效。

参数:
sample_weightstr、True、False 或 None,默认为 sklearn.utils.metadata_routing.UNCHANGED

fitsample_weight 参数的元数据路由。

返回:
selfobject

更新后的对象。

set_params(**params)[source]#

设置此估计器的参数。

此方法适用于简单的估计器以及嵌套对象(例如 Pipeline)。后者具有 <component>__<parameter> 形式的参数,因此可以更新嵌套对象的每个组件。

参数:
**params字典

估计器参数。

返回:
self估计器实例

估计器实例。

set_predict_request(*, return_std: bool | None | str = '$UNCHANGED$') DummyRegressor[source]#

传递给 predict 方法的请求元数据。

请注意,只有在 enable_metadata_routing=True 时(参见 sklearn.set_config)此方法才相关。请参见 用户指南,了解路由机制的工作原理。

每个参数的选项为

  • True:请求元数据,如果提供则将其传递给predict。如果没有提供元数据,则忽略此请求。

  • False:不请求元数据,元估计器不会将其传递给predict

  • None:不请求元数据,如果用户提供元数据,元估计器将引发错误。

  • str:元数据应使用此给定的别名而不是原始名称传递给元估计器。

默认值(sklearn.utils.metadata_routing.UNCHANGED)保留现有的请求。这允许您更改某些参数的请求而不更改其他参数的请求。

版本 1.3 中添加。

注意

仅当将此估计器用作元估计器的子估计器时(例如,在 Pipeline 中使用)此方法才相关。否则,它无效。

参数:
return_stdstr, True, False 或 None,默认值=sklearn.utils.metadata_routing.UNCHANGED

predict 方法中return_std 参数的元数据路由。

返回:
selfobject

更新后的对象。

set_score_request(*, sample_weight: bool | None | str = '$UNCHANGED$') DummyRegressor[source]#

请求传递给score 方法的元数据。

请注意,只有在 enable_metadata_routing=True 时(参见 sklearn.set_config)此方法才相关。请参见 用户指南,了解路由机制的工作原理。

每个参数的选项为

  • True:请求元数据,如果提供则将其传递给score。如果没有提供元数据,则忽略此请求。

  • False:不请求元数据,元估计器不会将其传递给score

  • None:不请求元数据,如果用户提供元数据,元估计器将引发错误。

  • str:元数据应使用此给定的别名而不是原始名称传递给元估计器。

默认值(sklearn.utils.metadata_routing.UNCHANGED)保留现有的请求。这允许您更改某些参数的请求而不更改其他参数的请求。

版本 1.3 中添加。

注意

仅当将此估计器用作元估计器的子估计器时(例如,在 Pipeline 中使用)此方法才相关。否则,它无效。

参数:
sample_weightstr、True、False 或 None,默认为 sklearn.utils.metadata_routing.UNCHANGED

score 方法中sample_weight 参数的元数据路由。

返回:
selfobject

更新后的对象。