check_cv#
- sklearn.model_selection.check_cv(cv=5, y=None, *, classifier=False)[source]#
用于构建交叉验证器的输入检查实用程序。
- 参数:
- cv整型、交叉验证生成器、可迭代对象或 None,默认值为 5
确定交叉验证的分割策略。cv 的可能输入包括: - None,使用默认的 5 折交叉验证, - 整型,指定折叠数。 - CV 分割器, - 一个可迭代对象,以索引数组的形式生成(训练集,测试集)分割。
对于整型/None 输入,如果 classifier 为 True 且
y
为二元或多类,则使用StratifiedKFold
。在所有其他情况下,使用KFold
。有关此处可用的各种交叉验证策略,请参阅用户指南。
版本 0.22 中的变化:
cv
的默认值从 3 折改为 5 折。- y类数组,默认值为 None
用于监督学习问题的目标变量。
- classifier布尔值,默认值为 False
任务是否为分类任务,在这种情况下将使用分层 KFold。
- 返回:
- checked_cv一个交叉验证器实例。
返回值是一个交叉验证器,它通过
split
方法生成训练/测试分割。
示例
>>> from sklearn.model_selection import check_cv >>> check_cv(cv=5, y=None, classifier=False) KFold(...) >>> check_cv(cv=5, y=[1, 1, 0, 0, 0, 0], classifier=True) StratifiedKFold(...)