跳到主内容
Ctrl+K
scikit-learn homepage scikit-learn homepage
  • 安装
  • 用户指南
  • API
  • 示例
  • 社区
    • 入门
    • 发布历史
    • 术语表
    • 开发
    • 常见问题
    • 支持
    • 相关项目
    • 路线图
    • 治理
    • 关于我们
  • GitHub
  • 安装
  • 用户指南
  • API
  • 示例
  • 社区
  • 入门
  • 发布历史
  • 术语表
  • 开发
  • 常见问题
  • 支持
  • 相关项目
  • 路线图
  • 治理
  • 关于我们
  • GitHub

章节导航

  • 1. 有监督学习
    • 1.1. 线性模型
    • 1.2. 线性判别分析与二次判别分析
    • 1.3. 核岭回归
    • 1.4. 支持向量机
    • 1.5. 随机梯度下降
    • 1.6. 最近邻
    • 1.7. 高斯过程
    • 1.8. 交叉分解
    • 1.9. 朴素贝叶斯
    • 1.10. 决策树
    • 1.11. 集成方法:梯度提升、随机森林、袋装法、投票法、堆叠法
    • 1.12. 多类别和多输出算法
    • 1.13. 特征选择
    • 1.14. 半监督学习
    • 1.15. 保序回归
    • 1.16. 概率校准
    • 1.17. 神经网络模型(有监督)
  • 2. 无监督学习
    • 2.1. 高斯混合模型
    • 2.2. 流形学习
    • 2.3. 聚类
    • 2.4. 双聚类
    • 2.5. 信号分量分解(矩阵分解问题)
    • 2.6. 协方差估计
    • 2.7. 新奇点和异常值检测
    • 2.8. 密度估计
    • 2.9. 神经网络模型(无监督)
  • 3. 模型选择与评估
    • 3.1. 交叉验证:评估估计器性能
    • 3.2. 调整估计器的超参数
    • 3.3. 调整类别预测的决策阈值
    • 3.4. 指标与评分:量化预测质量
    • 3.5. 验证曲线:绘制分数以评估模型
  • 4. 元数据路由
  • 5. 检查
    • 5.1. 偏依赖图与个体条件期望图
    • 5.2. 排列特征重要性
  • 6. 可视化
  • 7. 数据集转换
    • 7.1. 管道与复合估计器
    • 7.2. 特征提取
    • 7.3. 数据预处理
    • 7.4. 缺失值填充
    • 7.5. 无监督降维
    • 7.6. 随机投影
    • 7.7. 核近似
    • 7.8. 成对指标、相似度与核函数
    • 7.9. 转换预测目标(y)
  • 8. 数据集加载工具
    • 8.1. 玩具数据集
    • 8.2. 真实世界数据集
    • 8.3. 生成的数据集
    • 8.4. 加载其他数据集
  • 9. 使用 scikit-learn 进行计算
    • 9.1. 计算扩展策略:处理更大数据
    • 9.2. 计算性能
    • 9.3. 并行性、资源管理与配置
  • 10. 模型持久化
  • 11. 常见陷阱与推荐实践
  • 12. 调度
    • 12.1. 数组 API 支持(实验性)
  • 13. 选择合适的估计器
  • 14. 外部资源、视频与讲座
  • 用户指南
  • 3. 模型选择与评估

3. 模型选择与评估#

  • 3.1. 交叉验证:评估估计器性能
    • 3.1.1. 计算交叉验证指标
    • 3.1.2. 交叉验证迭代器
    • 3.1.3. 关于混洗的注意事项
    • 3.1.4. 交叉验证与模型选择
    • 3.1.5. 置换检验分数
  • 3.2. 调整估计器的超参数
    • 3.2.1. 网格搜索(穷举法)
    • 3.2.2. 随机参数优化
    • 3.2.3. 使用逐次减半法搜索最优参数
    • 3.2.4. 参数搜索技巧
    • 3.2.5. 暴力参数搜索的替代方案
  • 3.3. 调整类别预测的决策阈值
    • 3.3.1. 决策阈值后调整
  • 3.4. 指标与评分:量化预测质量
    • 3.4.1. 我应该使用哪个评分函数?
    • 3.4.2. 评分 API 概述
    • 3.4.3. scoring 参数:定义模型评估规则
    • 3.4.4. 分类指标
    • 3.4.5. 多标签排序指标
    • 3.4.6. 回归指标
    • 3.4.7. 聚类指标
    • 3.4.8. 虚拟估计器
  • 3.5. 验证曲线:绘制分数以评估模型
    • 3.5.1. 验证曲线
    • 3.5.2. 学习曲线

上一页

2.9. 神经网络模型(无监督)

下一页

3.1. 交叉验证:评估估计器性能

本页

  • 显示源文件

© 版权所有 2007 - 2025, scikit-learn 开发者 (BSD 许可证)。