sklearn.model_selection#

用于模型选择的工具,例如交叉验证和超参数调整。

用户指南。 欲了解更多详情,请参阅 交叉验证:评估估计器性能调整估计器的超参数学习曲线 部分。

拆分器#

GroupKFold

具有非重叠组的 K 折迭代器变体。

GroupShuffleSplit

Shuffle-Group(s)-Out 交叉验证迭代器。

KFold

K-Fold 交叉验证器。

LeaveOneGroupOut

Leave One Group Out 交叉验证器。

LeaveOneOut

Leave-One-Out 交叉验证器。

LeavePGroupsOut

Leave P Group(s) Out 交叉验证器。

LeavePOut

Leave-P-Out 交叉验证器。

PredefinedSplit

预定义拆分交叉验证器。

RepeatedKFold

重复 K-Fold 交叉验证器。

RepeatedStratifiedKFold

重复分层 K-Fold 交叉验证器。

ShuffleSplit

随机置换交叉验证器。

StratifiedGroupKFold

具有非重叠组的分层 K-Fold 迭代器变体。

StratifiedKFold

分层 K-Fold 交叉验证器。

StratifiedShuffleSplit

分层 ShuffleSplit 交叉验证器。

TimeSeriesSplit

时间序列交叉验证器。

check_cv

用于构建交叉验证器的输入检查实用程序。

train_test_split

将数组或矩阵拆分为随机训练集和测试子集。

超参数优化器#

GridSearchCV

对估算器的指定参数值进行穷举搜索。

HalvingGridSearchCV

使用 Successive Halving 对指定参数值进行搜索。

HalvingRandomSearchCV

对超参数进行随机搜索。

ParameterGrid

每个参数具有离散数量值的参数网格。

ParameterSampler

从给定分布中采样的参数生成器。

RandomizedSearchCV

对超参数进行随机搜索。

拟合后模型调整#

FixedThresholdClassifier

手动设置决策阈值的二元分类器。

TunedThresholdClassifierCV

使用交叉验证对决策阈值进行后调整的分类器。

模型验证#

cross_val_predict

为每个输入数据点生成交叉验证估计。

cross_val_score

通过交叉验证评估分数。

cross_validate

通过交叉验证评估指标,并记录拟合/评分时间。

learning_curve

学习曲线。

permutation_test_score

使用置换评估交叉验证分数的显著性。

validation_curve

验证曲线。

可视化#

LearningCurveDisplay

学习曲线可视化。

ValidationCurveDisplay

验证曲线可视化。