sklearn.model_selection#

用于模型选择的工具,例如交叉验证和超参数调优。

用户指南。 详见 交叉验证:评估估计器性能调优估计器的超参数学习曲线 小节。

分割器#

GroupKFold

带非重叠组的K折迭代器变体。

GroupShuffleSplit

乱序分组留出交叉验证迭代器。

KFold

K折交叉验证器。

LeaveOneGroupOut

留一分组交叉验证器。

LeaveOneOut

留一法交叉验证器。

LeavePGroupsOut

留P分组交叉验证器。

LeavePOut

留P法交叉验证器。

PredefinedSplit

预定义分割交叉验证器。

RepeatedKFold

重复K折交叉验证器。

RepeatedStratifiedKFold

重复类别分层K折交叉验证器。

ShuffleSplit

随机置换交叉验证器。

StratifiedGroupKFold

带非重叠组的类别分层K折迭代器变体。

StratifiedKFold

类别分层K折交叉验证器。

StratifiedShuffleSplit

类别分层乱序分割交叉验证器。

TimeSeriesSplit

时间序列交叉验证器。

check_cv

用于构建交叉验证器的输入检查实用工具。

train_test_split

将数组或矩阵分割成随机的训练集和测试集子集。

超参数优化器#

GridSearchCV

对估计器的指定参数值进行穷举搜索。

HalvingGridSearchCV

使用逐次减半对指定参数值进行搜索。

HalvingRandomSearchCV

对超参数进行随机搜索。

ParameterGrid

参数网格,每个参数具有离散数量的值。

ParameterSampler

从给定分布中采样参数的生成器。

RandomizedSearchCV

对超参数进行随机搜索。

后拟合模型调优#

FixedThresholdClassifier

手动设置决策阈值的二元分类器。

TunedThresholdClassifierCV

使用交叉验证对决策阈值进行后调优的分类器。

模型验证#

cross_val_predict

为每个输入数据点生成交叉验证估计。

cross_val_score

通过交叉验证评估分数。

cross_validate

通过交叉验证评估指标,并记录拟合/评分时间。

learning_curve

学习曲线。

permutation_test_score

通过置换评估交叉验证分数的显著性。

validation_curve

验证曲线。

可视化#

LearningCurveDisplay

学习曲线可视化。

ValidationCurveDisplay

验证曲线可视化。