sklearn.model_selection#

模型选择工具,例如交叉验证和超参数调整。

用户指南。 请参阅交叉验证:评估估计器性能调整估计器的超参数学习曲线章节了解更多详情。

分割器#

分组 K 折交叉验证 (GroupKFold)

具有非重叠分组的K折迭代器变体。

分组随机划分 (GroupShuffleSplit)

Shuffle-Group(s)-Out 交叉验证迭代器。

K 折交叉验证 (KFold)

K折交叉验证器。

留一组交叉验证 (LeaveOneGroupOut)

留一组交叉验证器。

留一法交叉验证 (LeaveOneOut)

留一法交叉验证器。

留 P 组交叉验证 (LeavePGroupsOut)

留P组交叉验证器。

留 P 法交叉验证 (LeavePOut)

留P法交叉验证器。

预定义划分 (PredefinedSplit)

预定义分割交叉验证器。

重复 K 折交叉验证 (RepeatedKFold)

重复K折交叉验证器。

重复分层 K 折交叉验证 (RepeatedStratifiedKFold)

重复分层K折交叉验证器。

随机划分 (ShuffleSplit)

随机排列交叉验证器。

分层分组 K 折交叉验证 (StratifiedGroupKFold)

具有非重叠分组的分层K折迭代器变体。

分层 K 折交叉验证 (StratifiedKFold)

分层K折交叉验证器。

分层随机划分 (StratifiedShuffleSplit)

分层ShuffleSplit交叉验证器。

时间序列分割 (TimeSeriesSplit)

时间序列交叉验证器。

检查交叉验证 (check_cv)

用于构建交叉验证器的输入检查器实用程序。

训练测试分割 (train_test_split)

将数组或矩阵分割成随机的训练集和测试集。

超参数优化器#

网格搜索 (GridSearchCV)

对估计器的指定参数值进行穷举搜索。

逐步网格搜索 (HalvingGridSearchCV)

使用连续减半法搜索指定的参数值。

逐步随机搜索 (HalvingRandomSearchCV)

超参数的随机搜索。

参数网格 (ParameterGrid)

每个参数具有离散数量值的网格。

参数采样器 (ParameterSampler)

从给定分布中采样参数的生成器。

随机搜索 (RandomizedSearchCV)

超参数的随机搜索。

拟合后模型调整#

固定阈值分类器 (FixedThresholdClassifier)

手动设置决策阈值的二元分类器。

调优阈值分类器 (TunedThresholdClassifierCV)

使用交叉验证对决策阈值进行后调整的分类器。

模型验证#

交叉验证预测 (cross_val_predict)

为每个输入数据点生成交叉验证估计。

交叉验证得分 (cross_val_score)

通过交叉验证评估分数。

交叉验证 (cross_validate)

通过交叉验证评估指标,并记录拟合/评分时间。

学习曲线 (learning_curve)

学习曲线。

置换检验得分 (permutation_test_score)

使用排列评估交叉验证分数的显著性。

验证曲线 (validation_curve)

验证曲线。

可视化#