注意

转到末尾下载完整的示例代码。或通过 JupyterLite 或 Binder 在浏览器中运行此示例

显示估计器和复杂管道#

此示例说明了估计器和管道的不同显示方式。

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

from sklearn.compose import make_column_transformer
from sklearn.impute import SimpleImputer
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import OneHotEncoder, StandardScaler

紧凑文本表示#

估计器在以字符串形式显示时，将只显示设置为非默认值的参数。这减少了视觉上的干扰，并使得比较实例时的差异更容易发现。

lr = LogisticRegression(penalty="l1")
print(lr)

LogisticRegression(penalty='l1')

富 HTML 表示#

在 Jupyter 笔记本中，估计器和管道将使用富 HTML 表示。这对于总结管道和其他复合估计器的结构特别有用，并具有提供详细信息的交互性。单击下面的示例图像以展开管道元素。请参阅可视化复合估计器，了解如何使用此功能。

num_proc = make_pipeline(SimpleImputer(strategy="median"), StandardScaler())

cat_proc = make_pipeline(
    SimpleImputer(strategy="constant", fill_value="missing"),
    OneHotEncoder(handle_unknown="ignore"),
)

preprocessor = make_column_transformer(
    (num_proc, ("feat1", "feat3")), (cat_proc, ("feat0", "feat2"))
)

clf = make_pipeline(preprocessor, LogisticRegression())
clf

Pipeline(steps=[('columntransformer',
                 ColumnTransformer(transformers=[('pipeline-1',
                                                  Pipeline(steps=[('simpleimputer',
                                                                   SimpleImputer(strategy='median')),
                                                                  ('standardscaler',
                                                                   StandardScaler())]),
                                                  ('feat1', 'feat3')),
                                                 ('pipeline-2',
                                                  Pipeline(steps=[('simpleimputer',
                                                                   SimpleImputer(fill_value='missing',
                                                                                 strategy='constant')),
                                                                  ('onehotencoder',
                                                                   OneHotEncoder(handle_unknown='ignore'))]),
                                                  ('feat0', 'feat2'))])),
                ('logisticregression', LogisticRegression())])

在 Jupyter 环境中，请重新运行此单元格以显示 HTML 表示或信任此笔记本。
在 GitHub 上，HTML 表示无法渲染，请尝试使用 nbviewer.org 加载此页面。

管道

?Pipeline 文档i未拟合

参数

	steps	[('columntransformer', ...), ('logisticregression', ...)]
	transform_input	None
	memory	None
	verbose	False

columntransformer: ColumnTransformer

?columntransformer: ColumnTransformer 文档

参数

	transformers	[('pipeline-1', ...), ('pipeline-2', ...)]
	remainder	'drop'
	sparse_threshold	0.3
	n_jobs	None
	transformer_weights	None
	verbose	False
	verbose_feature_names_out	True
	force_int_remainder_cols	'deprecated'

pipeline-1

('feat1', 'feat3')

SimpleImputer

?SimpleImputer 文档

参数

	missing_values	nan
	strategy	'median'
	fill_value	None
	copy	True
	add_indicator	False
	keep_empty_features	False

StandardScaler

?StandardScaler 文档

参数

	copy	True
	with_mean	True
	with_std	True

pipeline-2

('feat0', 'feat2')

SimpleImputer

?SimpleImputer 文档

参数

	missing_values	nan
	strategy	'constant'
	fill_value	'missing'
	copy	True
	add_indicator	False
	keep_empty_features	False

OneHotEncoder

?OneHotEncoder 文档

参数

	categories	'auto'
	drop	None
	sparse_output	True
	dtype	<class 'numpy.float64'>
	handle_unknown	'ignore'
	min_frequency	None
	max_categories	None
	feature_name_combiner	'concat'

LogisticRegression

?LogisticRegression 文档

参数

	penalty	'l2'
	dual	False
	tol	0.0001
	C	1.0
	fit_intercept	True
	intercept_scaling	1
	class_weight	None
	random_state	None
	solver	'lbfgs'
	max_iter	100
	multi_class	'deprecated'
	verbose	0
	warm_start	False
	n_jobs	None
	l1_ratio	None

脚本总运行时间： (0 分钟 0.030 秒)

显示估计器和复杂管道#

紧凑文本表示#

富 HTML 表示#

本页