make_pipeline#

sklearn.pipeline.make_pipeline(*steps, memory=None, transform_input=None, verbose=False)[source]#

从给定的估计器构造一个 Pipeline。

这是 Pipeline 构造函数的简写；它不需要，也不允许为估计器命名。相反，它们的名称将自动设置为其类型的全小写。

参数:

*stepsEstimator 对象列表

scikit-learn 估计器的列表，它们被串联在一起。

memory具有 joblib.Memory 接口的字符串或对象，默认为 None

用于缓存管道中已拟合的转换器。最后一步永远不会被缓存，即使它是一个转换器。默认情况下，不执行缓存。如果给定字符串，则它是缓存目录的路径。启用缓存会在拟合之前触发转换器的克隆。因此，不能直接检查提供给管道的转换器实例。使用属性 named_steps 或 steps 来检查管道中的估计器。当拟合耗时时，缓存转换器是有利的。

transform_input字符串列表，默认为 None

这允许将 fit 的某些输入参数（除了 X）通过管道的步骤进行转换，直到需要它们的步骤。要求通过元数据路由定义。例如，这可用于将验证集通过管道。

只有在启用元数据路由时才能设置此项，您可以通过使用 sklearn.set_config(enable_metadata_routing=True) 启用它。

在 1.6 版本中添加。

verbose布尔值，默认为 False

如果为 True，每个步骤拟合时所用的时间将在完成后打印出来。

返回:

pPipeline: 返回一个 scikit-learn Pipeline 对象。

另请参阅

Pipeline: 用于创建包含最终估计器的转换管道的类。

示例

>>> from sklearn.naive_bayes import GaussianNB
>>> from sklearn.preprocessing import StandardScaler
>>> from sklearn.pipeline import make_pipeline
>>> make_pipeline(StandardScaler(), GaussianNB(priors=None))
Pipeline(steps=[('standardscaler', StandardScaler()),
                ('gaussiannb', GaussianNB())])

画廊示例#

时间相关特征工程

时间相关特征工程

绘制分类概率

绘制分类概率

分类器比较

分类器比较

手写数字数据上的 K-Means 聚类演示

手写数字数据上的 K-Means 聚类演示

主成分回归 vs 偏最小二乘回归

主成分回归 vs 偏最小二乘回归

使用树集成进行特征转换

使用树集成进行特征转换

梯度提升中的分类特征支持

梯度提升中的分类特征支持

使用堆叠组合预测器

使用堆叠组合预测器

可视化 VotingClassifier 的概率预测

可视化 VotingClassifier 的概率预测

单变量特征选择

单变量特征选择

管道 ANOVA SVM

管道 ANOVA SVM

基于模型和序列特征选择

基于模型和序列特征选择

使用 IterativeImputer 变体填充缺失值

使用 IterativeImputer 变体填充缺失值

在构建估计器之前填充缺失值

在构建估计器之前填充缺失值

线性模型系数解释中的常见陷阱

线性模型系数解释中的常见陷阱

偏依赖和个体条件期望图

偏依赖和个体条件期望图

使用多项式核近似的可扩展学习

使用多项式核近似的可扩展学习

比较线性贝叶斯回归器

比较线性贝叶斯回归器

通过信息准则进行 Lasso 模型选择

通过信息准则进行 Lasso 模型选择

Lasso 模型选择：AIC-BIC / 交叉验证

Lasso 模型选择：AIC-BIC / 交叉验证

L1- 逻辑回归的正则化路径

L1- 逻辑回归的正则化路径

泊松回归和非正态损失

泊松回归和非正态损失

多项式和样条插值

多项式和样条插值

鲁棒线性估计器拟合

鲁棒线性估计器拟合

单类 SVM 与使用随机梯度下降的单类 SVM

单类 SVM 与使用随机梯度下降的单类 SVM

保险索赔上的 Tweedie 回归

保险索赔上的 Tweedie 回归

手写数字上的流形学习：局部线性嵌入，Isomap…

手写数字上的流形学习：局部线性嵌入，Isomap...

比较玩具数据集上的异常检测算法用于离群点检测

比较玩具数据集上的异常检测算法用于离群点检测

使用显示对象进行可视化

使用显示对象进行可视化

显示估计器和复杂管道

显示估计器和复杂管道

离群点检测估计器的评估

离群点检测估计器的评估

使用偏依赖进行高级绘图

使用偏依赖进行高级绘图

显示管道

介绍 set_output API

介绍 set_output API

成本敏感学习的决策阈值后调优

成本敏感学习的决策阈值后调优

检测错误权衡（DET）曲线

检测错误权衡（DET）曲线

精确率-召回率

精确率-召回率

决策函数截止点的后验调优

决策函数截止点的后验调优

TSNE 中的近似最近邻

TSNE 中的近似最近邻

使用邻域成分分析进行降维

使用邻域成分分析进行降维

多层感知器中的正则化变化

多层感知器中的正则化变化

特征离散化

特征离散化

特征缩放的重要性

特征缩放的重要性

比较目标编码器与其他编码器

比较目标编码器与其他编码器

目标编码器的内部交叉拟合

目标编码器的内部交叉拟合

scikit-learn 0.22 发布亮点

scikit-learn 0.22 发布亮点

scikit-learn 0.23 发布亮点

scikit-learn 0.23 发布亮点

scikit-learn 0.24 发布亮点

scikit-learn 0.24 发布亮点

scikit-learn 1.0 发布亮点

scikit-learn 1.0 发布亮点

scikit-learn 1.1 发布亮点

scikit-learn 1.1 发布亮点

scikit-learn 1.2 发布亮点

scikit-learn 1.2 发布亮点

scikit-learn 1.7 发布亮点

scikit-learn 1.7 发布亮点

使用 k-means 对文本文档进行聚类

使用 k-means 对文本文档进行聚类