注意

转到末尾以下载完整示例代码，或通过 JupyterLite 或 Binder 在浏览器中运行此示例。

梯度提升中的分类特征支持#

在此示例中，我们比较了 HistGradientBoostingRegressor 在不同分类特征编码策略下的训练时间和预测性能。具体来说，我们评估了以下策略：

“Dropped”（丢弃）：丢弃分类特征；
“One Hot”（独热编码）：使用 OneHotEncoder；
“Ordinal”（序数编码）：使用 OrdinalEncoder 并将类别视为有序、等距的量；
“Target”（目标编码）：使用 TargetEncoder；
“Native”（原生支持）：依赖 HistGradientBoostingRegressor 估计器的原生类别支持。

为此，我们使用 Ames Iowa Housing 数据集，该数据集包含数值和分类特征，目标是房屋销售价格。

有关 HistGradientBoostingRegressor 其他功能示例，请参阅直方图梯度提升树中的特征。

有关高基数分类特征存在时的编码策略比较，请参阅目标编码器与其他编码器的比较。

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

加载 Ames Housing 数据集#

首先，我们将 Ames Housing 数据作为 pandas 数据帧加载。特征要么是分类的，要么是数值的。

from sklearn.datasets import fetch_openml

X, y = fetch_openml(data_id=42165, as_frame=True, return_X_y=True)

# Select only a subset of features of X to make the example faster to run
categorical_columns_subset = [
    "BldgType",
    "GarageFinish",
    "LotConfig",
    "Functional",
    "MasVnrType",
    "HouseStyle",
    "FireplaceQu",
    "ExterCond",
    "ExterQual",
    "PoolQC",
]

numerical_columns_subset = [
    "3SsnPorch",
    "Fireplaces",
    "BsmtHalfBath",
    "HalfBath",
    "GarageCars",
    "TotRmsAbvGrd",
    "BsmtFinSF1",
    "BsmtFinSF2",
    "GrLivArea",
    "ScreenPorch",
]

X = X[categorical_columns_subset + numerical_columns_subset]
X[categorical_columns_subset] = X[categorical_columns_subset].astype("category")

categorical_columns = X.select_dtypes(include="category").columns
n_categorical_features = len(categorical_columns)
n_numerical_features = X.select_dtypes(include="number").shape[1]

print(f"Number of samples: {X.shape[0]}")
print(f"Number of features: {X.shape[1]}")
print(f"Number of categorical features: {n_categorical_features}")
print(f"Number of numerical features: {n_numerical_features}")

Number of samples: 1460
Number of features: 20
Number of categorical features: 10
Number of numerical features: 10

丢弃分类特征的梯度提升估计器#

作为基线，我们创建一个丢弃分类特征的估计器。

from sklearn.compose import make_column_selector, make_column_transformer
from sklearn.ensemble import HistGradientBoostingRegressor
from sklearn.pipeline import make_pipeline

dropper = make_column_transformer(
    ("drop", make_column_selector(dtype_include="category")), remainder="passthrough"
)
hist_dropped = make_pipeline(dropper, HistGradientBoostingRegressor(random_state=42))
hist_dropped

Pipeline(steps=[('columntransformer',
                 ColumnTransformer(remainder='passthrough',
                                   transformers=[('drop', 'drop',
                                                  <sklearn.compose._column_transformer.make_column_selector object at 0x7fb4a2b293d0>)])),
                ('histgradientboostingregressor',
                 HistGradientBoostingRegressor(random_state=42))])

在 Jupyter 环境中，请重新运行此单元格以显示 HTML 表示形式或信任 notebook。
在 GitHub 上，HTML 表示形式无法渲染，请尝试使用 nbviewer.org 加载此页面。

使用独热编码的梯度提升估计器#

接下来，我们创建一个流水线，用于对分类特征进行独热编码，同时让其余特征 "passthrough" 保持不变。

from sklearn.preprocessing import OneHotEncoder

one_hot_encoder = make_column_transformer(
    (
        OneHotEncoder(sparse_output=False, handle_unknown="ignore"),
        make_column_selector(dtype_include="category"),
    ),
    remainder="passthrough",
)

hist_one_hot = make_pipeline(
    one_hot_encoder, HistGradientBoostingRegressor(random_state=42)
)
hist_one_hot

Pipeline(steps=[('columntransformer',
                 ColumnTransformer(remainder='passthrough',
                                   transformers=[('onehotencoder',
                                                  OneHotEncoder(handle_unknown='ignore',
                                                                sparse_output=False),
                                                  <sklearn.compose._column_transformer.make_column_selector object at 0x7fb4a2b28f50>)])),
                ('histgradientboostingregressor',
                 HistGradientBoostingRegressor(random_state=42))])

在 Jupyter 环境中，请重新运行此单元格以显示 HTML 表示形式或信任 notebook。
在 GitHub 上，HTML 表示形式无法渲染，请尝试使用 nbviewer.org 加载此页面。

使用序数编码的梯度提升估计器#

接下来，我们创建一个流水线，将分类特征视为有序数量，即类别被编码为 0、1、2 等，并被视为连续特征。

import numpy as np

from sklearn.preprocessing import OrdinalEncoder

ordinal_encoder = make_column_transformer(
    (
        OrdinalEncoder(handle_unknown="use_encoded_value", unknown_value=np.nan),
        make_column_selector(dtype_include="category"),
    ),
    remainder="passthrough",
)

hist_ordinal = make_pipeline(
    ordinal_encoder, HistGradientBoostingRegressor(random_state=42)
)
hist_ordinal

Pipeline(steps=[('columntransformer',
                 ColumnTransformer(remainder='passthrough',
                                   transformers=[('ordinalencoder',
                                                  OrdinalEncoder(handle_unknown='use_encoded_value',
                                                                 unknown_value=nan),
                                                  <sklearn.compose._column_transformer.make_column_selector object at 0x7fb4a1b6f790>)])),
                ('histgradientboostingregressor',
                 HistGradientBoostingRegressor(random_state=42))])

在 Jupyter 环境中，请重新运行此单元格以显示 HTML 表示形式或信任 notebook。
在 GitHub 上，HTML 表示形式无法渲染，请尝试使用 nbviewer.org 加载此页面。

使用目标编码的梯度提升估计器#

另一种可能性是使用 TargetEncoder，它根据平滑的 np.mean(y, axis=0) 计算的（训练）目标变量的均值来编码类别，即：

在回归中，它使用 y 的均值；
在二元分类中，使用正类率；
在多类别分类中，使用类别率向量（每个类别一个）。

对于每个类别，它使用交叉拟合计算这些目标平均值，这意味着训练数据被分成几折：在每一折中，平均值仅在数据子集上计算，然后应用于保留部分。这样，每个样本都使用它未参与的数据中的统计信息进行编码，从而防止目标信息泄露。

from sklearn.preprocessing import TargetEncoder

target_encoder = make_column_transformer(
    (
        TargetEncoder(target_type="continuous", random_state=42),
        make_column_selector(dtype_include="category"),
    ),
    remainder="passthrough",
)

hist_target = make_pipeline(
    target_encoder, HistGradientBoostingRegressor(random_state=42)
)
hist_target

Pipeline(steps=[('columntransformer',
                 ColumnTransformer(remainder='passthrough',
                                   transformers=[('targetencoder',
                                                  TargetEncoder(random_state=42,
                                                                target_type='continuous'),
                                                  <sklearn.compose._column_transformer.make_column_selector object at 0x7fb4a1b6f2d0>)])),
                ('histgradientboostingregressor',
                 HistGradientBoostingRegressor(random_state=42))])

在 Jupyter 环境中，请重新运行此单元格以显示 HTML 表示形式或信任 notebook。
在 GitHub 上，HTML 表示形式无法渲染，请尝试使用 nbviewer.org 加载此页面。

具有原生分类支持的梯度提升估计器#

现在我们创建一个 HistGradientBoostingRegressor 估计器，它可以原生处理分类特征而无需显式编码。通过设置 categorical_features="from_dtype"（自动检测具有分类 dtypes 的特征），或者更明确地通过 categorical_features=categorical_columns_subset 来启用此功能。

与之前的编码方法不同，估计器原生处理分类特征。在每次拆分时，它使用一种启发式方法将此类特征的类别划分为不相交的集合，该方法根据类别对目标变量的影响对它们进行排序，详情请参阅 Split finding with categorical features。

虽然序数编码对于低基数特征可能效果很好，即使类别没有自然顺序，但随着基数增加，实现有意义的拆分需要更深的树。原生分类支持通过直接处理无序类别来避免这种情况。与独热编码相比，优点是省略了预处理，并且拟合和预测时间更快。

hist_native = HistGradientBoostingRegressor(
    random_state=42, categorical_features="from_dtype"
)
hist_native

HistGradientBoostingRegressor(random_state=42)

在 Jupyter 环境中，请重新运行此单元格以显示 HTML 表示形式或信任 notebook。
在 GitHub 上，HTML 表示形式无法渲染，请尝试使用 nbviewer.org 加载此页面。

模型比较#

在这里，我们使用交叉验证来比较模型在 mean_absolute_percentage_error 方面的性能和拟合时间。在即将出现的图中，误差条代表通过交叉验证拆分计算出的 1 个标准差。

from sklearn.model_selection import cross_validate

common_params = {"cv": 5, "scoring": "neg_mean_absolute_percentage_error", "n_jobs": -1}

dropped_result = cross_validate(hist_dropped, X, y, **common_params)
one_hot_result = cross_validate(hist_one_hot, X, y, **common_params)
ordinal_result = cross_validate(hist_ordinal, X, y, **common_params)
target_result = cross_validate(hist_target, X, y, **common_params)
native_result = cross_validate(hist_native, X, y, **common_params)
results = [
    ("Dropped", dropped_result),
    ("One Hot", one_hot_result),
    ("Ordinal", ordinal_result),
    ("Target", target_result),
    ("Native", native_result),
]

import matplotlib.pyplot as plt
import matplotlib.ticker as ticker


def plot_performance_tradeoff(results, title):
    fig, ax = plt.subplots()
    markers = ["s", "o", "^", "x", "D"]

    for idx, (name, result) in enumerate(results):
        test_error = -result["test_score"]
        mean_fit_time = np.mean(result["fit_time"])
        mean_score = np.mean(test_error)
        std_fit_time = np.std(result["fit_time"])
        std_score = np.std(test_error)

        ax.scatter(
            result["fit_time"],
            test_error,
            label=name,
            marker=markers[idx],
        )
        ax.scatter(
            mean_fit_time,
            mean_score,
            color="k",
            marker=markers[idx],
        )
        ax.errorbar(
            x=mean_fit_time,
            y=mean_score,
            yerr=std_score,
            c="k",
            capsize=2,
        )
        ax.errorbar(
            x=mean_fit_time,
            y=mean_score,
            xerr=std_fit_time,
            c="k",
            capsize=2,
        )

    ax.set_xscale("log")

    nticks = 7
    x0, x1 = np.log10(ax.get_xlim())
    ticks = np.logspace(x0, x1, nticks)
    ax.set_xticks(ticks)
    ax.xaxis.set_major_formatter(ticker.FormatStrFormatter("%1.1e"))
    ax.minorticks_off()

    ax.annotate(
        "  best\nmodels",
        xy=(0.04, 0.04),
        xycoords="axes fraction",
        xytext=(0.09, 0.14),
        textcoords="axes fraction",
        arrowprops=dict(arrowstyle="->", lw=1.5),
    )
    ax.set_xlabel("Time to fit (seconds)")
    ax.set_ylabel("Mean Absolute Percentage Error")
    ax.set_title(title)
    ax.legend()
    plt.show()


plot_performance_tradeoff(results, "Gradient Boosting on Ames Housing")

在上面的图中，"最佳模型"是那些更接近左下角的模型，如箭头所示。这些模型将对应于更快的拟合和更低的误差。

使用独热编码数据的模型最慢。这是可以预料到的，因为独热编码会为每个分类特征的每个类别值创建一个额外的特征，从而大大增加训练期间的拆分候选数量。理论上，我们预计原生处理分类特征会比将类别视为有序数量（“Ordinal”）略慢，因为原生处理需要对类别进行排序。然而，当类别数量较少时，拟合时间应该接近，但这在实践中可能并不总是得到体现。

使用 TargetEncoder 进行拟合所需的时间取决于交叉拟合参数 cv，因为增加拆分会带来计算成本。

在预测性能方面，丢弃分类特征会导致最差的性能。利用分类特征的四个模型具有可比的错误率，其中原生处理略有优势。

限制拆分次数#

通常，可以预期独热编码数据的预测效果较差，尤其是当树深或节点数受限时：对于独热编码数据，需要更多的拆分点，即更深的深度，才能恢复在原生处理中可以在一个拆分点获得的等效拆分。

当类别被视为序数量时也是如此：如果类别是 A..F 且最佳拆分是 ACF - BDE，则独热编码模型需要 3 个拆分点（左节点中每个类别一个），而序数非原生模型需要 4 个拆分：1 个拆分隔离 A，1 个拆分隔离 F，以及 2 个拆分隔离 C 和 BCDE。

模型性能在实践中差异的强度取决于数据集和树的灵活性。

为了说明这一点，让我们在欠拟合模型中重新运行相同的分析，其中我们通过限制树的数量和每棵树的深度来人为地限制总拆分次数。

for pipe in (hist_dropped, hist_one_hot, hist_ordinal, hist_target, hist_native):
    if pipe is hist_native:
        # The native model does not use a pipeline so, we can set the parameters
        # directly.
        pipe.set_params(max_depth=3, max_iter=15)
    else:
        pipe.set_params(
            histgradientboostingregressor__max_depth=3,
            histgradientboostingregressor__max_iter=15,
        )

dropped_result = cross_validate(hist_dropped, X, y, **common_params)
one_hot_result = cross_validate(hist_one_hot, X, y, **common_params)
ordinal_result = cross_validate(hist_ordinal, X, y, **common_params)
target_result = cross_validate(hist_target, X, y, **common_params)
native_result = cross_validate(hist_native, X, y, **common_params)
results_underfit = [
    ("Dropped", dropped_result),
    ("One Hot", one_hot_result),
    ("Ordinal", ordinal_result),
    ("Target", target_result),
    ("Native", native_result),
]

plot_performance_tradeoff(
    results_underfit, "Gradient Boosting on Ames Housing (few and shallow trees)"
)

Gradient Boosting on Ames Housing (few and shallow trees)

这些欠拟合模型的结果证实了我们先前的直觉：当拆分预算受限时，原生类别处理策略表现最佳。三种显式编码策略（独热编码、序数编码和目标编码）导致的误差略大于估计器的原生处理，但仍优于完全丢弃分类特征的基线模型。

脚本总运行时间： (0 minutes 4.379 seconds)

	steps steps: list of tuples 以顺序链式连接的 (name of step, estimator) 元组列表。为了与 scikit-learn API 兼容，所有步骤都必须定义 `fit`。所有非最后一步也必须定义 `transform`。有关更多详细信息，请参阅 :ref:`组合估计器 `。	[('columntransformer', ...), ('histgradientboostingregressor', ...)]
	transform_input transform_input: list of str, default=None 应在管道将其传递给使用它的步骤之前由管道转换的 :term:`metadata` 参数的名称。这使得可以转换 ``fit`` 的某些输入参数（除了 ``X``）以由管道的步骤进行转换，直到需要它们的步骤。需求通过 :ref:`元数据路由 ` 定义。例如，这可以用于将验证集传递给管道。只有在启用元数据路由时才能设置此项，您可以通过使用 ``sklearn.set_config(enable_metadata_routing=True)`` 来启用它。 .. versionadded:: 1.6	None
	memory memory: str or object with the joblib.Memory interface, default=None 用于缓存管道已拟合的转换器。最后一步永远不会被缓存，即使它是一个转换器。默认情况下，不执行缓存。如果给定字符串，它是缓存目录的路径。启用缓存会在拟合之前触发转换器的克隆。因此，不能直接检查提供给管道的转换器实例。使用属性 ``named_steps`` 或 ``steps`` 来检查管道中的估计器。当拟合耗时时，缓存转换器是有利的。有关如何启用缓存的示例，请参阅 :ref:`sphx_glr_auto_examples_neighbors_plot_caching_nearest_neighbors.py`。	None
	verbose verbose: bool, default=False 如果为 True，则在完成每个步骤时打印拟合所花费的时间。	False

	transformers transformers: list of tuples 列表 (name, transformer, columns) 形式的元组，指定要应用于数据子集的转换器对象。 name : str 与 Pipeline 和 FeatureUnion 中一样，这允许使用 ``set_params`` 来设置转换器及其参数，并在网格搜索中进行搜索。 transformer : {'drop', 'passthrough'} or estimator 估计器必须支持 :term:`fit` 和 :term:`transform`。特殊情况字符串 'drop' 和 'passthrough' 也被接受，分别表示丢弃列或按原样传递（不进行转换）。 columns : str, array-like of str, int, array-like of int, array-like of bool, slice or callable 索引数据在其第二个轴上。整数被解释为位置列，而字符串可以按名称引用 DataFrame 列。当 ``transformer`` 期望 X 为一维 array-like（向量）时，应使用标量字符串或整数，否则将把二维数组传递给转换器。可调用对象被传递输入数据 `X`，并且可以返回上述任何一种类型。要按名称或 dtype 选择多列，可以使用 :obj:`make_column_selector`。	[('drop', ...)]
	remainder remainder: {'drop', 'passthrough'} or estimator, default='drop' 默认情况下，只转换 `transformers` 中指定的列并将其组合在输出中，而未指定的列被删除。（默认值为 ``'drop'``）。通过指定 ``remainder='passthrough'``，所有未在 `transformers` 中指定但在传递给 `fit` 的数据中存在的剩余列将自动传递。此列子集与转换器的输出连接。对于数据框，在 `fit` 期间未见的额外列将从 `transform` 的输出中排除。通过将 ``remainder`` 设置为估计器，剩余的未指定列将使用 ``remainder`` 估计器。估计器必须支持 :term:`fit` 和 :term:`transform`。请注意，使用此功能要求在 :term:`fit` 和 :term:`transform` 时输入的 DataFrame 列具有相同的顺序。	'passthrough'
	sparse_threshold sparse_threshold: float, default=0.3 如果不同转换器的输出包含稀疏矩阵，则如果总体密度低于此值，它们将被堆叠为稀疏矩阵。使用 ``sparse_threshold=0`` 以始终返回密集矩阵。当转换后的输出全部由密集数据组成时，堆叠结果将是密集的，并且此关键字将被忽略。	0.3
	n_jobs n_jobs: int, default=None 并行运行的作业数。 ``None`` 表示 1，除非在 :obj:`joblib.parallel_backend` 上下文中。``-1`` 表示使用所有处理器。有关更多详细信息，请参阅 :term:`Glossary `。	None
	transformer_weights transformer_weights: dict, default=None 每个转换器特征的乘法权重。转换器的输出乘以这些权重。键是转换器名称，值是权重。	None
	verbose verbose: bool, default=False 如果为 True，则在完成每个转换器时打印拟合所花费的时间。	False
	verbose_feature_names_out verbose_feature_names_out: bool, str or Callable[[str, str], str], default=True - 如果为 True，:meth:`ColumnTransformer.get_feature_names_out` 将为所有特征名称加上生成该特征的转换器的名称作为前缀。它等同于设置 `verbose_feature_names_out="{transformer_name}__{feature_name}"`。 - 如果为 False，:meth:`ColumnTransformer.get_feature_names_out` 将不为任何特征名称加前缀，并且如果特征名称不唯一，则会报错。 - 如果为 ``Callable[[str, str], str]``，:meth:`ColumnTransformer.get_feature_names_out` 将使用转换器的名称重命名所有特征。可调用对象的第一个参数是转换器名称，第二个参数是特征名称。返回的字符串将是新的特征名称。 - 如果为 ``str``，它必须是一个准备好格式化的字符串。给定的字符串将使用两个字段名进行格式化：``transformer_name`` 和 ``feature_name``。例如 ``"{feature_name}__{transformer_name}"``。有关更多信息，请参阅标准库中的 :meth:`str.format` 方法。 .. versionadded:: 1.0 .. versionchanged:: 1.6 `verbose_feature_names_out` 可以是可调用对象或要格式化的字符串。	True
	force_int_remainder_cols force_int_remainder_cols: bool, default=False 此参数无效。 .. note:: 如果您不访问 `transformers_` 已拟合属性中剩余列的列列表，则无需设置此参数。 .. versionadded:: 1.5 .. versionchanged:: 1.7 `force_int_remainder_cols` 的默认值将从 `True` 更改为 `False`，在版本 1.7 中。 .. deprecated:: 1.7 `force_int_remainder_cols` 已弃用，并将在 1.9 版本中移除。	'deprecated'

	loss loss: {'squared_error', 'absolute_error', 'gamma', 'poisson', 'quantile'}, default='squared_error' 提升过程中使用的损失函数。请注意，“squared error”、“gamma”和“poisson”损失实际上实现了“半最小二乘损失”、“半伽马离差”和“半泊松离差”，以简化梯度计算。此外，“gamma”和“poisson”损失内部使用对数链接，“gamma”要求 ``y > 0``，而“poisson”要求 ``y >= 0``。 “quantile”使用 pinball loss。 .. versionchanged:: 0.23 添加了选项 'poisson'。 .. versionchanged:: 1.1 添加了选项 'quantile'。 .. versionchanged:: 1.3 添加了选项 'gamma'。	'squared_error'
	quantile quantile: float, default=None 如果 loss 为 "quantile"，此参数指定要估计的分位数，并且必须介于 0 和 1 之间。	None
	learning_rate learning_rate: float, default=0.1 学习率，也称为收缩率。这用作叶子值的乘法因子。使用 ``1`` 表示无收缩。	0.1
	max_iter max_iter: int, default=100 提升过程的最大迭代次数，即最大树数。	100
	max_leaf_nodes max_leaf_nodes: int or None, default=31 每棵树的最大叶子数。必须严格大于 1。如果为 None，则没有最大限制。	31
	max_depth max_depth: int or None, default=None 每棵树的最大深度。树的深度是从根到最深叶子的边数。默认情况下不限制深度。	None
	min_samples_leaf min_samples_leaf: int, default=20 每个叶子的最小样本数。对于少于几百个样本的小数据集，建议降低此值，因为只会构建非常浅的树。	20
	l2_regularization l2_regularization: float, default=0 L2 正则化参数，惩罚具有小 hessians 的叶子。使用 ``0`` 表示无正则化（默认）。	0.0
	max_features max_features: float, default=1.0 每个节点拆分中随机选择的特征比例。这是一种正则化形式，较小的值使树成为较弱的学习器，并可能防止过拟合。如果存在来自 `interaction_cst` 的交互约束，则只考虑允许的特征进行子采样。 .. versionadded:: 1.4	1.0
	max_bins max_bins: int, default=255 用于非缺失值的最大分箱数。在训练之前，输入数组 `X` 的每个特征都被分箱为整数值分箱，这使得训练阶段快得多。具有少量唯一值的特征可能使用少于 ``max_bins`` 个分箱。除了 ``max_bins`` 个分箱之外，始终为缺失值保留一个分箱。必须不大于 255。	255
	categorical_features categorical_features: array-like of {bool, int, str} of shape (n_features) or shape (n_categorical_features,), default='from_dtype' 指示分类特征。 - None : 不考虑任何特征为分类特征。 - boolean array-like : 指示分类特征的布尔掩码。 - integer array-like : 指示分类特征的整数索引。 - str array-like: 分类特征的名称（假设训练数据具有特征名称）。 - `"from_dtype"`: dtype 为 "category" 的 dataframe 列被视为分类特征。要使用此功能，输入必须是公开 ``__dataframe__`` 方法的对象，例如 pandas 或 polars DataFrames。对于每个分类特征，最多必须有 `max_bins` 个唯一类别。编码为数值 dtype 的分类特征的负值被视为缺失值。所有分类值都转换为浮点数。这意味着分类值 1.0 和 1 被视为同一类别。在 :ref:`User Guide ` 和 :ref:`sphx_glr_auto_examples_ensemble_plot_gradient_boosting_categorical.py` 中阅读更多信息。 .. versionadded:: 0.24 .. versionchanged:: 1.2 添加了对特征名称的支持。 .. versionchanged:: 1.4 添加了 `"from_dtype"` 选项。 .. versionchanged:: 1.6 默认值从 `None` 更改为 `"from_dtype"`。	'from_dtype'
	monotonic_cst monotonic_cst: array-like of int of shape (n_features) or dict, default=None 对每个特征强制执行的单调约束使用以下整数值指定： - 1: 单调增加 - 0: 无约束 - -1: 单调减少如果为带有 str 键的 dict，则按名称将特征映射到单调约束。如果为 array，则按位置将特征映射到约束。有关使用示例，请参阅 :ref:`monotonic_cst_features_names`。在 :ref:`User Guide ` 中阅读更多内容。 .. versionadded:: 0.23 .. versionchanged:: 1.2 接受以特征名称为键的约束 dict。	None
	interaction_cst interaction_cst: {"pairwise", "no_interactions"} or sequence of lists/tuples/sets of int, default=None 指定交互约束，即允许在子节点拆分中相互交互的特征集。每个项指定允许相互交互的特征索引集。如果特征多于这些约束中指定的特征，则将它们视为指定为附加集。字符串 "pairwise" 和 "no_interactions" 分别是仅允许成对交互或不允许交互的简写。例如，总共有 5 个特征，`interaction_cst=[{0, 1}]` 等同于 `interaction_cst=[{0, 1}, {2, 3, 4}]`，并指定树的每个分支要么只在特征 0 和 1 上拆分，要么只在特征 2、3 和 4 上拆分。有关如何使用 `interaction_cst`，请参阅 :ref:`this example`。 .. versionadded:: 1.2	None
	warm_start warm_start: bool, default=False 当设置为 ``True`` 时，重用对 fit 的前一次调用的解决方案，并向集成添加更多估计器。为了使结果有效，估计器应仅在相同数据上重新训练。请参阅 :term:`Glossary `。	False
	early_stopping early_stopping: 'auto' or bool, default='auto' 如果为 'auto'，则如果样本大小大于 10000 或者如果将 `X_val` 和 `y_val` 传递给 `fit`，则启用提前停止。如果为 True，则启用提前停止，否则禁用提前停止。 .. versionadded:: 0.23	'auto'
	scoring scoring: str or callable or None, default='loss' 用于提前停止的评分方法。仅当启用 `early_stopping` 时使用。选项： - str: 有关选项，请参阅 :ref:`scoring_string_names`。 - callable: 具有签名 ``scorer(estimator, X, y)`` 的评分器可调用对象（例如函数）。有关详细信息，请参阅 :ref:`scoring_callable`。 - `None`: 使用 :ref:`决定系数 ` (:math:`R^2`)。 - 'loss': 根据损失值检查提前停止。	'loss'
	validation_fraction validation_fraction: int or float or None, default=0.1 用于提前停止的训练数据中留出作为验证数据的比例（或绝对大小）。如果为 None，则在训练数据上进行提前停止。如果未执行提前停止（例如 `early_stopping=False`）或者如果将 `X_val` 和 `y_val` 传递给 fit，则忽略此值。	0.1
	n_iter_no_change n_iter_no_change: int, default=10 用于确定何时“提前停止”。当最后 ``n_iter_no_change`` 个分数都没有比倒数第 ``n_iter_no_change - 1`` 个分数好（在一定的容差范围内）时，拟合过程停止。仅当执行提前停止时使用。	10
	tol tol: float, default=1e-7 在提前停止期间比较分数时使用的绝对容差。容差越高，我们越有可能提前停止：较高的容差意味着后续迭代更难被认为是参考分数的改进。	1e-07
	verbose verbose: int, default=0 详细程度级别。如果不为零，则打印有关拟合过程的一些信息。``1`` 只打印摘要信息，``2`` 打印每次迭代的信息。	0
	random_state random_state: int, RandomState instance or None, default=None 伪随机数生成器，用于控制分箱过程中的子采样，以及如果启用提前停止时的训练/验证数据拆分。传递一个 int 值以在多次函数调用中获得可重现的输出。请参阅 :term:`Glossary `。	42

	steps steps: list of tuples 以顺序链式连接的 (name of step, estimator) 元组列表。为了与 scikit-learn API 兼容，所有步骤都必须定义 `fit`。所有非最后一步也必须定义 `transform`。有关更多详细信息，请参阅 :ref:`组合估计器 `。	[('columntransformer', ...), ('histgradientboostingregressor', ...)]
	transform_input transform_input: list of str, default=None 应在管道将其传递给使用它的步骤之前由管道转换的 :term:`metadata` 参数的名称。这使得可以转换 ``fit`` 的某些输入参数（除了 ``X``）以由管道的步骤进行转换，直到需要它们的步骤。需求通过 :ref:`元数据路由 ` 定义。例如，这可以用于将验证集传递给管道。只有在启用元数据路由时才能设置此项，您可以通过使用 ``sklearn.set_config(enable_metadata_routing=True)`` 来启用它。 .. versionadded:: 1.6	None
	memory memory: str or object with the joblib.Memory interface, default=None 用于缓存管道已拟合的转换器。最后一步永远不会被缓存，即使它是一个转换器。默认情况下，不执行缓存。如果给定字符串，它是缓存目录的路径。启用缓存会在拟合之前触发转换器的克隆。因此，不能直接检查提供给管道的转换器实例。使用属性 ``named_steps`` 或 ``steps`` 来检查管道中的估计器。当拟合耗时时，缓存转换器是有利的。有关如何启用缓存的示例，请参阅 :ref:`sphx_glr_auto_examples_neighbors_plot_caching_nearest_neighbors.py`。	None
	verbose verbose: bool, default=False 如果为 True，则在完成每个步骤时打印拟合所花费的时间。	False

	transformers transformers: list of tuples 列表 (name, transformer, columns) 形式的元组，指定要应用于数据子集的转换器对象。 name : str 与 Pipeline 和 FeatureUnion 中一样，这允许使用 ``set_params`` 来设置转换器及其参数，并在网格搜索中进行搜索。 transformer : {'drop', 'passthrough'} or estimator 估计器必须支持 :term:`fit` 和 :term:`transform`。特殊情况字符串 'drop' 和 'passthrough' 也被接受，分别表示丢弃列或按原样传递（不进行转换）。 columns : str, array-like of str, int, array-like of int, array-like of bool, slice or callable 索引数据在其第二个轴上。整数被解释为位置列，而字符串可以按名称引用 DataFrame 列。当 ``transformer`` 期望 X 为一维 array-like（向量）时，应使用标量字符串或整数，否则将把二维数组传递给转换器。可调用对象被传递输入数据 `X`，并且可以返回上述任何一种类型。要按名称或 dtype 选择多列，可以使用 :obj:`make_column_selector`。	[('onehotencoder', ...)]
	remainder remainder: {'drop', 'passthrough'} or estimator, default='drop' 默认情况下，只转换 `transformers` 中指定的列并将其组合在输出中，而未指定的列被删除。（默认值为 ``'drop'``）。通过指定 ``remainder='passthrough'``，所有未在 `transformers` 中指定但在传递给 `fit` 的数据中存在的剩余列将自动传递。此列子集与转换器的输出连接。对于数据框，在 `fit` 期间未见的额外列将从 `transform` 的输出中排除。通过将 ``remainder`` 设置为估计器，剩余的未指定列将使用 ``remainder`` 估计器。估计器必须支持 :term:`fit` 和 :term:`transform`。请注意，使用此功能要求在 :term:`fit` 和 :term:`transform` 时输入的 DataFrame 列具有相同的顺序。	'passthrough'
	sparse_threshold sparse_threshold: float, default=0.3 如果不同转换器的输出包含稀疏矩阵，则如果总体密度低于此值，它们将被堆叠为稀疏矩阵。使用 ``sparse_threshold=0`` 以始终返回密集矩阵。当转换后的输出全部由密集数据组成时，堆叠结果将是密集的，并且此关键字将被忽略。	0.3
	n_jobs n_jobs: int, default=None 并行运行的作业数。 ``None`` 表示 1，除非在 :obj:`joblib.parallel_backend` 上下文中。``-1`` 表示使用所有处理器。有关更多详细信息，请参阅 :term:`Glossary `。	None
	transformer_weights transformer_weights: dict, default=None 每个转换器特征的乘法权重。转换器的输出乘以这些权重。键是转换器名称，值是权重。	None
	verbose verbose: bool, default=False 如果为 True，则在完成每个转换器时打印拟合所花费的时间。	False
	verbose_feature_names_out verbose_feature_names_out: bool, str or Callable[[str, str], str], default=True - 如果为 True，:meth:`ColumnTransformer.get_feature_names_out` 将为所有特征名称加上生成该特征的转换器的名称作为前缀。它等同于设置 `verbose_feature_names_out="{transformer_name}__{feature_name}"`。 - 如果为 False，:meth:`ColumnTransformer.get_feature_names_out` 将不为任何特征名称加前缀，并且如果特征名称不唯一，则会报错。 - 如果为 ``Callable[[str, str], str]``，:meth:`ColumnTransformer.get_feature_names_out` 将使用转换器的名称重命名所有特征。可调用对象的第一个参数是转换器名称，第二个参数是特征名称。返回的字符串将是新的特征名称。 - 如果为 ``str``，它必须是一个准备好格式化的字符串。给定的字符串将使用两个字段名进行格式化：``transformer_name`` 和 ``feature_name``。例如 ``"{feature_name}__{transformer_name}"``。有关更多信息，请参阅标准库中的 :meth:`str.format` 方法。 .. versionadded:: 1.0 .. versionchanged:: 1.6 `verbose_feature_names_out` 可以是可调用对象或要格式化的字符串。	True
	force_int_remainder_cols force_int_remainder_cols: bool, default=False 此参数无效。 .. note:: 如果您不访问 `transformers_` 已拟合属性中剩余列的列列表，则无需设置此参数。 .. versionadded:: 1.5 .. versionchanged:: 1.7 `force_int_remainder_cols` 的默认值将从 `True` 更改为 `False`，在版本 1.7 中。 .. deprecated:: 1.7 `force_int_remainder_cols` 已弃用，并将在 1.9 版本中移除。	'deprecated'

	categories categories: 'auto' or a list of array-like, default='auto' 每个特征的类别（唯一值）： - 'auto'：从训练数据中自动确定类别。 - list：``categories[i]`` 包含第 i 列中预期的类别。传递的类别不应在单个特征内混合字符串和数值，并且在数值的情况下应已排序。使用的类别可以在 ``categories_`` 属性中找到。 .. versionadded:: 0.20	'auto'
	drop drop: {'first', 'if_binary'} or an array-like of shape (n_features,), default=None 指定用于丢弃每个特征的一个类别的方法。这在完美共线特征导致问题的情况下很有用，例如将结果数据输入到未正则化的线性回归模型中时。然而，丢弃一个类别打破了原始表示的对称性，因此可能在下游模型中引入偏差，例如对于惩罚性线性分类或回归模型。 - None : 保留所有特征（默认）。 - 'first' : 丢弃每个特征中的第一个类别。如果只有一个类别存在，则该特征将被完全丢弃。 - 'if_binary' : 丢弃具有两个类别的每个特征中的第一个类别。具有 1 个或超过 2 个类别的特征保持不变。 - array : ``drop[i]`` 是特征 ``X[:, i]`` 中应被丢弃的类别。当配置 `max_categories` 或 `min_frequency` 以对不常见类别进行分组时，丢弃行为在分组之后处理。 .. versionadded:: 0.21 参数 `drop` 在 0.21 中添加。 .. versionchanged:: 0.23 选项 `drop='if_binary'` 在 0.23 中添加。 .. versionchanged:: 1.1 支持丢弃不常见类别。	None
	sparse_output sparse_output: bool, default=True 当 ``True`` 时，返回一个 :class:`scipy.sparse.csr_matrix`，即“压缩稀疏行”（CSR）格式的稀疏矩阵。 .. versionadded:: 1.2 `sparse` 已重命名为 `sparse_output`	False
	dtype dtype: number type, default=np.float64 所需输出数据类型。	<class 'numpy.float64'>
	handle_unknown handle_unknown: {'error', 'ignore', 'infrequent_if_exist', 'warn'}, default='error' 指定在 :meth:`transform` 期间处理未知类别的方式。 - 'error' : 如果在转换期间存在未知类别，则引发错误。 - 'ignore' : 当在转换期间遇到未知类别时，该特征的生成的独热编码列将全部为零。在逆转换中，未知类别将表示为 None。 - 'infrequent_if_exist' : 当在转换期间遇到未知类别时，如果存在不常见类别，该特征生成的独热编码列将映射到不常见类别。不常见类别将映射到编码中的最后一个位置。在逆转换期间，如果存在，未知类别将映射到表示为 `'infrequent'` 的类别。如果 `'infrequent'` 类别不存在，则 :meth:`transform` 和 :meth:`inverse_transform` 将像 `handle_unknown='ignore'` 一样处理未知类别。不常见类别的存在基于 `min_frequency` 和 `max_categories`。在 :ref:`User Guide ` 中阅读更多信息。 - 'warn' : 当在转换期间遇到未知类别时，会发出警告，然后编码过程如 `handle_unknown="infrequent_if_exist"` 所述进行。 .. versionchanged:: 1.1 添加了 `'infrequent_if_exist'` 以自动处理未知类别和不常见类别。 .. versionadded:: 1.6 选项 `"warn"` 在 1.6 中添加。	'ignore'
	min_frequency min_frequency: int or float, default=None 指定类别被视为不常见的最小频率。 - 如果为 `int`，则基数小于此值的类别将被视为不常见。 - 如果为 `float`，则基数小于 `min_frequency * n_samples` 的类别将被视为不常见。 .. versionadded:: 1.1 在 :ref:`User Guide ` 中阅读更多信息。	None
	max_categories max_categories: int, default=None 指定当考虑不常见类别时，每个输入特征的输出特征数量的上限。如果存在不常见类别，`max_categories` 包括表示不常见类别的类别以及常见类别。如果为 `None`，则输出特征数量没有限制。 .. versionadded:: 1.1 在 :ref:`User Guide ` 中阅读更多信息。	None
	feature_name_combiner feature_name_combiner: "concat" or callable, default="concat" 具有签名 `def callable(input_feature, category)` 的可调用对象，返回一个字符串。这用于创建由 :meth:`get_feature_names_out` 返回的特征名称。 `"concat"` 使用 `feature + "_" + str(category)` 连接编码特征名称和类别。例如，具有值 1、6、7 的特征 X 创建特征名称 `X_1, X_6, X_7`。 .. versionadded:: 1.3	'concat'

	transformers transformers: list of tuples 列表 (name, transformer, columns) 形式的元组，指定要应用于数据子集的转换器对象。 name : str 与 Pipeline 和 FeatureUnion 中一样，这允许使用 ``set_params`` 来设置转换器及其参数，并在网格搜索中进行搜索。 transformer : {'drop', 'passthrough'} or estimator 估计器必须支持 :term:`fit` 和 :term:`transform`。特殊情况字符串 'drop' 和 'passthrough' 也被接受，分别表示丢弃列或按原样传递（不进行转换）。 columns : str, array-like of str, int, array-like of int, array-like of bool, slice or callable 索引数据在其第二个轴上。整数被解释为位置列，而字符串可以按名称引用 DataFrame 列。当 ``transformer`` 期望 X 为一维 array-like（向量）时，应使用标量字符串或整数，否则将把二维数组传递给转换器。可调用对象被传递输入数据 `X`，并且可以返回上述任何一种类型。要按名称或 dtype 选择多列，可以使用 :obj:`make_column_selector`。	[('ordinalencoder', ...)]
	remainder remainder: {'drop', 'passthrough'} or estimator, default='drop' 默认情况下，只转换 `transformers` 中指定的列并将其组合在输出中，而未指定的列被删除。（默认值为 ``'drop'``）。通过指定 ``remainder='passthrough'``，所有未在 `transformers` 中指定但在传递给 `fit` 的数据中存在的剩余列将自动传递。此列子集与转换器的输出连接。对于数据框，在 `fit` 期间未见的额外列将从 `transform` 的输出中排除。通过将 ``remainder`` 设置为估计器，剩余的未指定列将使用 ``remainder`` 估计器。估计器必须支持 :term:`fit` 和 :term:`transform`。请注意，使用此功能要求在 :term:`fit` 和 :term:`transform` 时输入的 DataFrame 列具有相同的顺序。	'passthrough'
	sparse_threshold sparse_threshold: float, default=0.3 如果不同转换器的输出包含稀疏矩阵，则如果总体密度低于此值，它们将被堆叠为稀疏矩阵。使用 ``sparse_threshold=0`` 以始终返回密集矩阵。当转换后的输出全部由密集数据组成时，堆叠结果将是密集的，并且此关键字将被忽略。	0.3
	n_jobs n_jobs: int, default=None 并行运行的作业数。 ``None`` 表示 1，除非在 :obj:`joblib.parallel_backend` 上下文中。``-1`` 表示使用所有处理器。有关更多详细信息，请参阅 :term:`Glossary `。	None
	transformer_weights transformer_weights: dict, default=None 每个转换器特征的乘法权重。转换器的输出乘以这些权重。键是转换器名称，值是权重。	None
	verbose verbose: bool, default=False 如果为 True，则在完成每个转换器时打印拟合所花费的时间。	False
	verbose_feature_names_out verbose_feature_names_out: bool, str or Callable[[str, str], str], default=True - 如果为 True，:meth:`ColumnTransformer.get_feature_names_out` 将为所有特征名称加上生成该特征的转换器的名称作为前缀。它等同于设置 `verbose_feature_names_out="{transformer_name}__{feature_name}"`。 - 如果为 False，:meth:`ColumnTransformer.get_feature_names_out` 将不为任何特征名称加前缀，并且如果特征名称不唯一，则会报错。 - 如果为 ``Callable[[str, str], str]``，:meth:`ColumnTransformer.get_feature_names_out` 将使用转换器的名称重命名所有特征。可调用对象的第一个参数是转换器名称，第二个参数是特征名称。返回的字符串将是新的特征名称。 - 如果为 ``str``，它必须是一个准备好格式化的字符串。给定的字符串将使用两个字段名进行格式化：``transformer_name`` 和 ``feature_name``。例如 ``"{feature_name}__{transformer_name}"``。有关更多信息，请参阅标准库中的 :meth:`str.format` 方法。 .. versionadded:: 1.0 .. versionchanged:: 1.6 `verbose_feature_names_out` 可以是可调用对象或要格式化的字符串。	True
	force_int_remainder_cols force_int_remainder_cols: bool, default=False 此参数无效。 .. note:: 如果您不访问 `transformers_` 已拟合属性中剩余列的列列表，则无需设置此参数。 .. versionadded:: 1.5 .. versionchanged:: 1.7 `force_int_remainder_cols` 的默认值将从 `True` 更改为 `False`，在版本 1.7 中。 .. deprecated:: 1.7 `force_int_remainder_cols` 已弃用，并将在 1.9 版本中移除。	'deprecated'

	transformers transformers: list of tuples 列表 (name, transformer, columns) 形式的元组，指定要应用于数据子集的转换器对象。 name : str 与 Pipeline 和 FeatureUnion 中一样，这允许使用 ``set_params`` 来设置转换器及其参数，并在网格搜索中进行搜索。 transformer : {'drop', 'passthrough'} or estimator 估计器必须支持 :term:`fit` 和 :term:`transform`。特殊情况字符串 'drop' 和 'passthrough' 也被接受，分别表示丢弃列或按原样传递（不进行转换）。 columns : str, array-like of str, int, array-like of int, array-like of bool, slice or callable 索引数据在其第二个轴上。整数被解释为位置列，而字符串可以按名称引用 DataFrame 列。当 ``transformer`` 期望 X 为一维 array-like（向量）时，应使用标量字符串或整数，否则将把二维数组传递给转换器。可调用对象被传递输入数据 `X`，并且可以返回上述任何一种类型。要按名称或 dtype 选择多列，可以使用 :obj:`make_column_selector`。	[('targetencoder', ...)]
	remainder remainder: {'drop', 'passthrough'} or estimator, default='drop' 默认情况下，只转换 `transformers` 中指定的列并将其组合在输出中，而未指定的列被删除。（默认值为 ``'drop'``）。通过指定 ``remainder='passthrough'``，所有未在 `transformers` 中指定但在传递给 `fit` 的数据中存在的剩余列将自动传递。此列子集与转换器的输出连接。对于数据框，在 `fit` 期间未见的额外列将从 `transform` 的输出中排除。通过将 ``remainder`` 设置为估计器，剩余的未指定列将使用 ``remainder`` 估计器。估计器必须支持 :term:`fit` 和 :term:`transform`。请注意，使用此功能要求在 :term:`fit` 和 :term:`transform` 时输入的 DataFrame 列具有相同的顺序。	'passthrough'
	sparse_threshold sparse_threshold: float, default=0.3 如果不同转换器的输出包含稀疏矩阵，则如果总体密度低于此值，它们将被堆叠为稀疏矩阵。使用 ``sparse_threshold=0`` 以始终返回密集矩阵。当转换后的输出全部由密集数据组成时，堆叠结果将是密集的，并且此关键字将被忽略。	0.3
	n_jobs n_jobs: int, default=None 并行运行的作业数。 ``None`` 表示 1，除非在 :obj:`joblib.parallel_backend` 上下文中。``-1`` 表示使用所有处理器。有关更多详细信息，请参阅 :term:`Glossary `。	None
	transformer_weights transformer_weights: dict, default=None 每个转换器特征的乘法权重。转换器的输出乘以这些权重。键是转换器名称，值是权重。	None
	verbose verbose: bool, default=False 如果为 True，则在完成每个转换器时打印拟合所花费的时间。	False
	verbose_feature_names_out verbose_feature_names_out: bool, str or Callable[[str, str], str], default=True - 如果为 True，:meth:`ColumnTransformer.get_feature_names_out` 将为所有特征名称加上生成该特征的转换器的名称作为前缀。它等同于设置 `verbose_feature_names_out="{transformer_name}__{feature_name}"`。 - 如果为 False，:meth:`ColumnTransformer.get_feature_names_out` 将不为任何特征名称加前缀，并且如果特征名称不唯一，则会报错。 - 如果为 ``Callable[[str, str], str]``，:meth:`ColumnTransformer.get_feature_names_out` 将使用转换器的名称重命名所有特征。可调用对象的第一个参数是转换器名称，第二个参数是特征名称。返回的字符串将是新的特征名称。 - 如果为 ``str``，它必须是一个准备好格式化的字符串。给定的字符串将使用两个字段名进行格式化：``transformer_name`` 和 ``feature_name``。例如 ``"{feature_name}__{transformer_name}"``。有关更多信息，请参阅标准库中的 :meth:`str.format` 方法。 .. versionadded:: 1.0 .. versionchanged:: 1.6 `verbose_feature_names_out` 可以是可调用对象或要格式化的字符串。	True
	force_int_remainder_cols force_int_remainder_cols: bool, default=False 此参数无效。 .. note:: 如果您不访问 `transformers_` 已拟合属性中剩余列的列列表，则无需设置此参数。 .. versionadded:: 1.5 .. versionchanged:: 1.7 `force_int_remainder_cols` 的默认值将从 `True` 更改为 `False`，在版本 1.7 中。 .. deprecated:: 1.7 `force_int_remainder_cols` 已弃用，并将在 1.9 版本中移除。	'deprecated'

	categories categories: "auto" or list of shape (n_features,) of array-like, default="auto" 每个特征的类别（唯一值）： - `"auto"` : 从训练数据中自动确定类别。 - list : `categories[i]` 包含第 i 列中预期的类别。传递的类别不应在单个特征内混合字符串和数值，并且在数值的情况下应进行排序。使用的类别存储在 `categories_` 拟合属性中。	'auto'
	target_type target_type: {"auto", "continuous", "binary", "multiclass"}, default="auto" 目标类型。 - `"auto"` : 使用 :func:`~sklearn.utils.multiclass.type_of_target` 推断目标类型。 - `"continuous"` : 连续目标 - `"binary"` : 二元目标 - `"multiclass"` : 多类别目标 .. note:: 使用 `"auto"` 推断的目标类型可能不是建模所需的理想目标类型。例如，如果目标由 0 到 100 之间的整数组成，则 :func:`~sklearn.utils.multiclass.type_of_target` 将推断目标为 `"multiclass"`。在这种情况下，设置 `target_type="continuous"` 将把目标指定为回归问题。`target_type_` 属性给出了编码器使用的目标类型。 .. versionchanged:: 1.4 添加了 'multiclass' 选项。	'continuous'
	smooth smooth: "auto" or float, default="auto" 目标均值与全局目标均值混合的程度，以类别值为条件。较大的 `smooth` 值将对全局目标均值赋予更大的权重。如果为 `"auto"`，则 `smooth` 设置为经验贝叶斯估计值。	'auto'
	cv cv: int, default=5 确定在 :meth:`fit_transform` 中使用的 :term:`cross fitting` 策略中的折数。对于分类目标，使用 `StratifiedKFold`；对于连续目标，使用 `KFold`。	5
	shuffle shuffle: bool, default=True 在 :meth:`fit_transform` 中将数据拆分为折叠之前是否洗牌。请注意，每个拆分内的样本不会被洗牌。	True
	random_state random_state: int, RandomState instance or None, default=None 当 `shuffle` 为 True 时，`random_state` 会影响索引的顺序，从而控制每个折叠的随机性。否则，此参数无效。传递一个整数可在多次函数调用中获得可重现的输出。请参阅 :term:`Glossary `。	42

梯度提升中的分类特征支持#

加载 Ames Housing 数据集#

丢弃分类特征的梯度提升估计器#

使用独热编码的梯度提升估计器#

使用序数编码的梯度提升估计器#

使用目标编码的梯度提升估计器#

具有原生分类支持的梯度提升估计器#

模型比较#

限制拆分次数#

本页