注意
转到结尾 下载完整的示例代码。或者通过JupyterLite或Binder在浏览器中运行此示例
使用FrozenEstimator
的示例#
此示例展示了FrozenEstimator
的一些用例。
FrozenEstimator
是一个实用程序类,允许冻结已拟合的估计器。例如,当我们想要将已拟合的估计器传递给元估计器(例如FixedThresholdClassifier
)时,而不让元估计器重新拟合估计器,这非常有用。
# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause
为预拟合分类器设置决策阈值#
scikit-learn中的拟合分类器使用任意决策阈值来决定给定样本属于哪个类别。决策阈值在decision_function返回的值上为0.0
,或者在predict_proba返回的概率上为0.5
。
但是,人们可能希望设置自定义决策阈值。我们可以通过使用FixedThresholdClassifier
并将分类器与FrozenEstimator
包装起来来做到这一点。
from sklearn.datasets import make_classification
from sklearn.frozen import FrozenEstimator
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import FixedThresholdClassifier, train_test_split
X, y = make_classification(n_samples=1000, random_state=0)
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)
classifier = LogisticRegression().fit(X_train, y_train)
print(
"Probability estimates for three data points:\n"
f"{classifier.predict_proba(X_test[-3:]).round(3)}"
)
print(
"Predicted class for the same three data points:\n"
f"{classifier.predict(X_test[-3:])}"
)
Probability estimates for three data points:
[[0.18 0.82]
[0.29 0.71]
[0. 1. ]]
Predicted class for the same three data points:
[1 1 1]
现在假设您想在概率估计上设置不同的决策阈值。我们可以通过将分类器与FrozenEstimator
包装起来并将其传递给FixedThresholdClassifier
来实现。
threshold_classifier = FixedThresholdClassifier(
estimator=FrozenEstimator(classifier), threshold=0.9
)
请注意,在上面的代码片段中,在FixedThresholdClassifier
上调用fit
不会重新拟合底层分类器。
现在,让我们看看预测相对于概率阈值是如何变化的。
print(
"Probability estimates for three data points with FixedThresholdClassifier:\n"
f"{threshold_classifier.predict_proba(X_test[-3:]).round(3)}"
)
print(
"Predicted class for the same three data points with FixedThresholdClassifier:\n"
f"{threshold_classifier.predict(X_test[-3:])}"
)
Probability estimates for three data points with FixedThresholdClassifier:
[[0.18 0.82]
[0.29 0.71]
[0. 1. ]]
Predicted class for the same three data points with FixedThresholdClassifier:
[0 0 1]
我们看到概率估计保持不变,但是由于使用了不同的决策阈值,预测的类别是不同的。
请参考代价敏感学习的决策阈值后调优以了解代价敏感学习和决策阈值调优。
预拟合分类器的校准#
您可以使用FrozenEstimator
使用CalibratedClassifierCV
校准预拟合分类器。
from sklearn.calibration import CalibratedClassifierCV
from sklearn.metrics import brier_score_loss
calibrated_classifier = CalibratedClassifierCV(
estimator=FrozenEstimator(classifier)
).fit(X_train, y_train)
prob_pos_clf = classifier.predict_proba(X_test)[:, 1]
clf_score = brier_score_loss(y_test, prob_pos_clf)
print(f"No calibration: {clf_score:.3f}")
prob_pos_calibrated = calibrated_classifier.predict_proba(X_test)[:, 1]
calibrated_score = brier_score_loss(y_test, prob_pos_calibrated)
print(f"With calibration: {calibrated_score:.3f}")
No calibration: 0.033
With calibration: 0.032
脚本总运行时间:(0分钟0.017秒)
相关示例
scikit-learn 1.5 发行亮点
分类器的概率校准
概率校准曲线
事后调整决策函数的截止点