check_cv#

sklearn.model_selection.check_cv(cv=5, y=None, *, classifier=False)[source]#

用于构建交叉验证器的输入检查实用程序。

参数:
cv整型、交叉验证生成器、可迭代对象或 None,默认值为 5

确定交叉验证的分割策略。cv 的可能输入包括: - None,使用默认的 5 折交叉验证, - 整型,指定折叠数。 - CV 分割器, - 一个可迭代对象,以索引数组的形式生成(训练集,测试集)分割。

对于整型/None 输入,如果 classifier 为 True 且 y 为二元或多类,则使用 StratifiedKFold。在所有其他情况下,使用 KFold

有关此处可用的各种交叉验证策略,请参阅用户指南

版本 0.22 中的变化: cv 的默认值从 3 折改为 5 折。

y类数组,默认值为 None

用于监督学习问题的目标变量。

classifier布尔值,默认值为 False

任务是否为分类任务,在这种情况下将使用分层 KFold。

返回:
checked_cv一个交叉验证器实例。

返回值是一个交叉验证器,它通过 split 方法生成训练/测试分割。

示例

>>> from sklearn.model_selection import check_cv
>>> check_cv(cv=5, y=None, classifier=False)
KFold(...)
>>> check_cv(cv=5, y=[1, 1, 0, 0, 0, 0], classifier=True)
StratifiedKFold(...)