检查交叉验证#

sklearn.model_selection.check_cv(cv=5, y=None, *, classifier=False)[source]#

构建交叉验证器的输入检查器实用程序。

参数:
cvint、交叉验证生成器、迭代器或 None,默认为 5

确定交叉验证拆分策略。cv 的可能输入为:- None,使用默认的 5 折交叉验证,- 整数,指定折叠数。- CV 分割器,- 生成 (train, test) 分割的迭代器,以索引数组的形式。

对于整数/None 输入,如果 classifier 为 True 且 y 为二元或多元分类,则使用 StratifiedKFold。在所有其他情况下,使用 KFold

请参考 用户指南了解此处可使用的各种交叉验证策略。

0.22 版本中的变更: cv 的默认值从 3 折更改为 5 折。

y类数组,默认为 None

监督学习问题的目标变量。

classifier布尔值,默认为 False

任务是否为分类任务,如果是,则将使用分层 KFold。

返回:
checked_cv交叉验证器实例。

返回值是一个交叉验证器,它通过 split 方法生成训练/测试分割。

示例

>>> from sklearn.model_selection import check_cv
>>> check_cv(cv=5, y=None, classifier=False)
KFold(...)
>>> check_cv(cv=5, y=[1, 1, 0, 0, 0, 0], classifier=True)
StratifiedKFold(...)