make_pipeline#

sklearn.pipeline.make_pipeline(*steps, memory=None, transform_input=None, verbose=False)[源代码]#

从给定的估计器构建一个 Pipeline

这是 Pipeline 构造函数的简写形式;它不需要,也不允许为估计器命名。相反,它们的名称将自动设置为其类型的全小写形式。

参数:
*stepsEstimator 对象列表

链接在一起的 scikit-learn 估计器列表。

memorystr 或具有 joblib.Memory 接口的对象, 默认为 None

用于缓存管道的已拟合的转换器。最后一个步骤将永远不会被缓存,即使它是一个转换器。默认情况下,不执行任何缓存。如果给出字符串,则为缓存目录的路径。启用缓存会触发在拟合之前对转换器进行克隆。因此,不能直接检查传递给管道的转换器实例。使用属性 named_stepssteps 来检查管道内的估计器。当拟合耗时时,缓存转换器是有益的。

transform_input字符串列表,默认=None

这使得一些传递给 fit 的输入参数(除了 X)可以通过管道中的步骤进行转换,直到需要它们的步骤。需求通过 元数据路由 定义。例如,这可以用于将验证集通过管道进行传递。

只有当启用了元数据路由时,才能设置此项,您可以使用 sklearn.set_config(enable_metadata_routing=True) 来启用它。

版本 1.6 中新增。

verbosebool, default=False

如果为 True,则在每个步骤完成拟合时,将打印出经过的时间。

返回:
pPipeline

返回一个 scikit-learn Pipeline 对象。

另请参阅

Pipeline

用于创建具有最终估计器的转换器管道的类。

示例

>>> from sklearn.naive_bayes import GaussianNB
>>> from sklearn.preprocessing import StandardScaler
>>> from sklearn.pipeline import make_pipeline
>>> make_pipeline(StandardScaler(), GaussianNB(priors=None))
Pipeline(steps=[('standardscaler', StandardScaler()),
                ('gaussiannb', GaussianNB())])