跳过至主要内容
Ctrl+K
scikit-learn homepage scikit-learn homepage
  • 安装
  • 用户指南
  • API
  • 示例
  • 社区
    • 入门
    • 发布历史
    • 术语表
    • 开发
    • 常见问题
    • 支持
    • 相关项目
    • 路线图
    • 治理
    • 机构支持
    • 关于我们
  • GitHub
  • 安装
  • 用户指南
  • API
  • 示例
  • 社区
  • 入门
  • 发布历史
  • 术语表
  • 开发
  • 常见问题
  • 支持
  • 相关项目
  • 路线图
  • 治理
  • 机构支持
  • 关于我们
  • GitHub

部分导航

  • 1. 有监督学习
    • 1.1. 线性模型
    • 1.2. 线性判别分析和二次判别分析
    • 1.3. 核岭回归
    • 1.4. 支持向量机
    • 1.5. 随机梯度下降
    • 1.6. K近邻
    • 1.7. 高斯过程
    • 1.8. 交叉分解
    • 1.9. 朴素贝叶斯
    • 1.10. 决策树
    • 1.11. 集成方法:梯度提升、随机森林、bagging、投票、堆叠
    • 1.12. 多类别和多输出算法
    • 1.13. 特征选择
    • 1.14. 半监督学习
    • 1.15. 保序回归
    • 1.16. 概率校准
    • 1.17. 神经网络模型(有监督)
  • 2. 无监督学习
    • 2.1. 高斯混合模型
    • 2.2. 流形学习
    • 2.3. 聚类
    • 2.4. 双向聚类
    • 2.5. 信号分解(矩阵分解问题)
    • 2.6. 协方差估计
    • 2.7. 新颖性检测和离群点检测
    • 2.8. 密度估计
    • 2.9. 神经网络模型(无监督)
  • 3. 模型选择和评估
    • 3.1. 交叉验证:评估估计器性能
    • 3.2. 调整估计器的超参数
    • 3.3. 调整类别预测的决策阈值
    • 3.4. 指标和评分:量化预测质量
    • 3.5. 验证曲线:绘制分数以评估模型
  • 4. 元数据路由
  • 5. 检查
    • 5.1. 部分依赖图和个体条件期望图
    • 5.2. 排列特征重要性
  • 6. 可视化
  • 7. 回调
  • 8. 数据集转换
    • 8.1. 流水线与复合估计器
    • 8.2. 特征提取
    • 8.3. 数据预处理
    • 8.4. 缺失值插补
    • 8.5. 无监督降维
    • 8.6. 随机投影
    • 8.7. 核近似
    • 8.8. 成对度量、亲和力与核函数
    • 8.9. 转换预测目标 (y)
  • 9. 数据集加载工具
    • 9.1. 玩具数据集
    • 9.2. 真实世界数据集
    • 9.3. 生成的数据集
    • 9.4. 加载其他数据集
  • 10. 使用 scikit-learn 进行计算
    • 10.1. 扩大计算规模的策略:更大规模的数据
    • 10.2. 计算性能
    • 10.3. 并行、资源管理和配置
  • 11. 模型持久化
  • 12. 常见陷阱与推荐实践
  • 13. 数据互操作性
    • 13.1. 针对转换器使用 set_output API 的 Pandas/Polars 输出
    • 13.2. 数组 API 支持(实验性)
  • 14. 选择正确的估计器
  • 15. 外部资源、视频与演讲
  • 用户指南
  • 3. 模型选择和评估

3. 模型选择与评估#

  • 3.1. 交叉验证:评估估计器性能
    • 3.1.1. 计算交叉验证指标
    • 3.1.2. 交叉验证迭代器
    • 3.1.3. 关于洗牌的注意事项
    • 3.1.4. 交叉验证和模型选择
    • 3.1.5. 置换检验分数
  • 3.2. 调整估计器的超参数
    • 3.2.1. 详尽网格搜索
    • 3.2.2. 随机参数优化
    • 3.2.3. 使用逐次减半搜索最佳参数
    • 3.2.4. 参数搜索技巧
    • 3.2.5. 暴力参数搜索的替代方案
  • 3.3. 调整类别预测的决策阈值
    • 3.3.1. 后调整决策阈值
  • 3.4. 指标和评分:量化预测质量
    • 3.4.1. 我应该使用哪个评分函数?
    • 3.4.2. 评分 API 概述
    • 3.4.3. scoring 参数:定义模型评估规则
    • 3.4.4. 分类指标
    • 3.4.5. 多标签排序指标
    • 3.4.6. 回归指标
    • 3.4.7. 聚类指标
    • 3.4.8. 哑估计器
  • 3.5. 验证曲线:绘制分数以评估模型
    • 3.5.1. 验证曲线
    • 3.5.2. 学习曲线

上一页

2.9. 神经网络模型(无监督)

下一页

3.1. 交叉验证:评估估计器性能


scikit-learn 得到 Probabl 及其他机构的财务支持。

企业级解决方案与服务

© Copyright 2007 - 2026, scikit-learn 开发者 (BSD 许可证)。