显示估计器和复杂管道#

此示例说明了显示估计器和管道的不同方法。

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

from sklearn.compose import make_column_transformer
from sklearn.impute import SimpleImputer
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import OneHotEncoder, StandardScaler

简洁文本表示#

当以字符串形式显示时,估计器只会显示设置为非默认值的参数。这减少了视觉干扰,并使比较实例时更容易发现差异。

lr = LogisticRegression(penalty="l1")
print(lr)
LogisticRegression(penalty='l1')

丰富的 HTML 表示#

在笔记本中,估计器和管道将使用丰富的 HTML 表示。这对于总结管道和其他复合估计器的结构特别有用,并具有交互性以提供详细信息。单击下面的示例图像以展开管道元素。请参阅 可视化复合估计器,了解如何使用此功能。

num_proc = make_pipeline(SimpleImputer(strategy="median"), StandardScaler())

cat_proc = make_pipeline(
    SimpleImputer(strategy="constant", fill_value="missing"),
    OneHotEncoder(handle_unknown="ignore"),
)

preprocessor = make_column_transformer(
    (num_proc, ("feat1", "feat3")), (cat_proc, ("feat0", "feat2"))
)

clf = make_pipeline(preprocessor, LogisticRegression())
clf
Pipeline(steps=[('columntransformer',
                 ColumnTransformer(transformers=[('pipeline-1',
                                                  Pipeline(steps=[('simpleimputer',
                                                                   SimpleImputer(strategy='median')),
                                                                  ('standardscaler',
                                                                   StandardScaler())]),
                                                  ('feat1', 'feat3')),
                                                 ('pipeline-2',
                                                  Pipeline(steps=[('simpleimputer',
                                                                   SimpleImputer(fill_value='missing',
                                                                                 strategy='constant')),
                                                                  ('onehotencoder',
                                                                   OneHotEncoder(handle_unknown='ignore'))]),
                                                  ('feat0', 'feat2'))])),
                ('logisticregression', LogisticRegression())])
在 Jupyter 环境中,请重新运行此单元格以显示 HTML 表示或信任笔记本。
在 GitHub 上,HTML 表示无法呈现,请尝试使用 nbviewer.org 加载此页面。


脚本总运行时间:(0 分钟 0.027 秒)

相关示例

显示管道

显示管道

使用堆叠组合预测器

使用堆叠组合预测器

scikit-learn 0.23 的发行亮点

scikit-learn 0.23 的发行亮点

具有混合类型的列转换器

具有混合类型的列转换器

由 Sphinx-Gallery 生成的图库