make_pipeline#
- sklearn.pipeline.make_pipeline(*steps, memory=None, transform_input=None, verbose=False)[source]#
从给定的估计器构造一个
Pipeline
。这是
Pipeline
构造函数的简写;它不需要,也不允许为估计器命名。相反,它们的名称将自动设置为其类型的全小写。- 参数:
- *stepsEstimator 对象列表
scikit-learn 估计器的列表,它们被串联在一起。
- memory具有 joblib.Memory 接口的字符串或对象,默认为 None
用于缓存管道中已拟合的转换器。最后一步永远不会被缓存,即使它是一个转换器。默认情况下,不执行缓存。如果给定字符串,则它是缓存目录的路径。启用缓存会在拟合之前触发转换器的克隆。因此,不能直接检查提供给管道的转换器实例。使用属性
named_steps
或steps
来检查管道中的估计器。当拟合耗时时,缓存转换器是有利的。- transform_input字符串列表,默认为 None
这允许将
fit
的某些输入参数(除了X
)通过管道的步骤进行转换,直到需要它们的步骤。要求通过元数据路由定义。例如,这可用于将验证集通过管道。只有在启用元数据路由时才能设置此项,您可以通过使用
sklearn.set_config(enable_metadata_routing=True)
启用它。在 1.6 版本中添加。
- verbose布尔值,默认为 False
如果为 True,每个步骤拟合时所用的时间将在完成后打印出来。
- 返回:
- pPipeline
返回一个 scikit-learn
Pipeline
对象。
另请参阅
Pipeline
用于创建包含最终估计器的转换管道的类。
示例
>>> from sklearn.naive_bayes import GaussianNB >>> from sklearn.preprocessing import StandardScaler >>> from sklearn.pipeline import make_pipeline >>> make_pipeline(StandardScaler(), GaussianNB(priors=None)) Pipeline(steps=[('standardscaler', StandardScaler()), ('gaussiannb', GaussianNB())])