make_pipeline#

sklearn.pipeline.make_pipeline(*steps, memory=None, transform_input=None, verbose=False)[源代码]#

从给定的估计器构建一个 Pipeline。

这是 Pipeline 构造函数的简写形式；它不需要，也不允许为估计器命名。相反，它们的名称将自动设置为其类型的全小写形式。

参数:

*stepsEstimator 对象列表

链接在一起的 scikit-learn 估计器列表。

memorystr 或具有 joblib.Memory 接口的对象, 默认为 None

用于缓存管道的已拟合的转换器。最后一个步骤将永远不会被缓存，即使它是一个转换器。默认情况下，不执行任何缓存。如果给出字符串，则为缓存目录的路径。启用缓存会触发在拟合之前对转换器进行克隆。因此，不能直接检查传递给管道的转换器实例。使用属性 named_steps 或 steps 来检查管道内的估计器。当拟合耗时时，缓存转换器是有益的。

transform_input字符串列表，默认=None

这使得一些传递给 fit 的输入参数（除了 X）可以通过管道中的步骤进行转换，直到需要它们的步骤。需求通过元数据路由定义。例如，这可以用于将验证集通过管道进行传递。

只有当启用了元数据路由时，才能设置此项，您可以使用 sklearn.set_config(enable_metadata_routing=True) 来启用它。

版本 1.6 中新增。

verbosebool, default=False

如果为 True，则在每个步骤完成拟合时，将打印出经过的时间。

返回:

pPipeline: 返回一个 scikit-learn Pipeline 对象。

另请参阅

Pipeline: 用于创建具有最终估计器的转换器管道的类。

示例

>>> from sklearn.naive_bayes import GaussianNB
>>> from sklearn.preprocessing import StandardScaler
>>> from sklearn.pipeline import make_pipeline
>>> make_pipeline(StandardScaler(), GaussianNB(priors=None))
Pipeline(steps=[('standardscaler', StandardScaler()),
                ('gaussiannb', GaussianNB())])

Gallery examples#

时间相关特征工程

时间相关特征工程

绘制分类概率

绘制分类概率

分类器比较

分类器比较

在手写数字数据上演示 K-Means 聚类

在手写数字数据上演示 K-Means 聚类

主成分回归 vs 偏最小二乘回归

主成分回归 vs 偏最小二乘回归

使用树集成进行特征转换

使用树集成进行特征转换

梯度提升中的分类特征支持

梯度提升中的分类特征支持

使用堆叠组合预测器

使用堆叠组合预测器

可视化 VotingClassifier 的概率预测

可视化 VotingClassifier 的概率预测

单变量特征选择

单变量特征选择

管道 ANOVA SVM

管道 ANOVA SVM

基于模型和顺序特征选择

基于模型和顺序特征选择

使用 IterativeImputer 变体插补缺失值

使用 IterativeImputer 变体插补缺失值

在构建估计器之前插补缺失值

在构建估计器之前插补缺失值

线性模型系数解释中的常见陷阱

线性模型系数解释中的常见陷阱

部分依赖和个体条件期望图

部分依赖和个体条件期望图

使用多项式核近似进行可扩展学习

使用多项式核近似进行可扩展学习

比较线性贝叶斯回归器

比较线性贝叶斯回归器

通过信息准则进行 Lasso 模型选择

通过信息准则进行 Lasso 模型选择

Lasso 模型选择：AIC-BIC / 交叉验证

Lasso 模型选择：AIC-BIC / 交叉验证

L1 逻辑回归的正则化路径

L1 逻辑回归的正则化路径

泊松回归和非正态损失

泊松回归和非正态损失

多项式和样条插值

多项式和样条插值

鲁棒线性估计器拟合

鲁棒线性估计器拟合

One-Class SVM vs 使用随机梯度下降的 One-Class SVM

One-Class SVM vs 使用随机梯度下降的 One-Class SVM

保险索赔上的 Tweedie 回归

保险索赔上的 Tweedie 回归

手写数字上的流形学习：局部线性嵌入、Isomap…

手写数字流形学习：局部线性嵌入、Isomap...

在玩具数据集上比较用于离群点检测的异常检测算法

在玩具数据集上比较用于离群点检测的异常检测算法

使用显示对象进行可视化

使用显示对象进行可视化

显示估计器和复杂管道

显示估计器和复杂管道

离群点检测估计器的评估

离群点检测估计器的评估

使用部分依赖进行高级绘图

使用部分依赖进行高级绘图

显示管道

介绍 set_output API

介绍 set_output API

后验调整成本敏感学习的决策阈值

后验调整成本敏感学习的决策阈值

检测错误权衡（DET）曲线

检测错误权衡（DET）曲线

精确率-召回率

精确率-召回率

后验调整决策函数的截止点

后验调整决策函数的截止点

TSNE 中的近似最近邻

TSNE 中的近似最近邻

使用邻域成分分析进行降维

使用邻域成分分析进行降维

多层感知器中的不同正则化

多层感知器中的不同正则化

特征离散化

特征离散化

特征缩放的重要性

特征缩放的重要性

比较目标编码器与其他编码器

比较目标编码器与其他编码器

目标编码器的内部交叉拟合

目标编码器的内部交叉拟合

scikit-learn 0.22 发布亮点

scikit-learn 0.22 发布亮点

scikit-learn 0.23 发布亮点

scikit-learn 0.23 发布亮点

scikit-learn 0.24 发布亮点

scikit-learn 0.24 发布亮点

scikit-learn 1.0 发布亮点

scikit-learn 1.0 发布亮点

scikit-learn 1.1 发布亮点

scikit-learn 1.1 发布亮点

scikit-learn 1.2 发布亮点

scikit-learn 1.2 发布亮点

scikit-learn 1.7 发布亮点

scikit-learn 1.7 发布亮点

scikit-learn 1.8 发布亮点

scikit-learn 1.8 发布亮点

使用 k-means 对文本文档进行聚类

使用 k-means 对文本文档进行聚类