make_pipeline#

sklearn.pipeline.make_pipeline(*steps, memory=None, transform_input=None, verbose=False)[source]#

从给定的估计器构造一个 Pipeline

这是 Pipeline 构造函数的简写;它不需要,也不允许为估计器命名。相反,它们的名称将自动设置为其类型的全小写。

参数:
*stepsEstimator 对象列表

scikit-learn 估计器的列表,它们被串联在一起。

memory具有 joblib.Memory 接口的字符串或对象,默认为 None

用于缓存管道中已拟合的转换器。最后一步永远不会被缓存,即使它是一个转换器。默认情况下,不执行缓存。如果给定字符串,则它是缓存目录的路径。启用缓存会在拟合之前触发转换器的克隆。因此,不能直接检查提供给管道的转换器实例。使用属性 named_stepssteps 来检查管道中的估计器。当拟合耗时时,缓存转换器是有利的。

transform_input字符串列表,默认为 None

这允许将 fit 的某些输入参数(除了 X)通过管道的步骤进行转换,直到需要它们的步骤。要求通过元数据路由定义。例如,这可用于将验证集通过管道。

只有在启用元数据路由时才能设置此项,您可以通过使用 sklearn.set_config(enable_metadata_routing=True) 启用它。

在 1.6 版本中添加。

verbose布尔值,默认为 False

如果为 True,每个步骤拟合时所用的时间将在完成后打印出来。

返回:
pPipeline

返回一个 scikit-learn Pipeline 对象。

另请参阅

Pipeline

用于创建包含最终估计器的转换管道的类。

示例

>>> from sklearn.naive_bayes import GaussianNB
>>> from sklearn.preprocessing import StandardScaler
>>> from sklearn.pipeline import make_pipeline
>>> make_pipeline(StandardScaler(), GaussianNB(priors=None))
Pipeline(steps=[('standardscaler', StandardScaler()),
                ('gaussiannb', GaussianNB())])