跳到主要内容
Ctrl+K
scikit-learn homepage scikit-learn homepage
  • 安装
  • 用户指南
  • API
  • 示例
  • 社区
    • 入门
    • 发布历史
    • 术语表
    • 开发
    • 常见问题
    • 支持
    • 相关项目
    • 路线图
    • 治理
    • 关于我们
  • GitHub
  • 安装
  • 用户指南
  • API
  • 示例
  • 社区
  • 入门
  • 发布历史
  • 术语表
  • 开发
  • 常见问题
  • 支持
  • 相关项目
  • 路线图
  • 治理
  • 关于我们
  • GitHub

章节导航

  • 1. 监督学习
    • 1.1. 线性模型
    • 1.2. 线性判别分析和二次判别分析
    • 1.3. 核岭回归
    • 1.4. 支持向量机
    • 1.5. 随机梯度下降
    • 1.6. 最近邻
    • 1.7. 高斯过程
    • 1.8. 交叉分解
    • 1.9. 朴素贝叶斯
    • 1.10. 决策树
    • 1.11. 集成方法: 梯度提升、随机森林、Bagging、投票、堆叠
    • 1.12. 多分类和多输出算法
    • 1.13. 特征选择
    • 1.14. 半监督学习
    • 1.15. 等渗回归
    • 1.16. 概率校准
    • 1.17. 神经网络模型 (监督)
  • 2. 无监督学习
    • 2.1. 高斯混合模型
    • 2.2. 流形学习
    • 2.3. 聚类
    • 2.4. 双聚类
    • 2.5. 分量信号分解 (矩阵分解问题)
    • 2.6. 协方差估计
    • 2.7. 新奇性和异常值检测
    • 2.8. 密度估计
    • 2.9. 神经网络模型 (无监督)
  • 3. 模型选择与评估
    • 3.1. 交叉验证: 评估估计器性能
    • 3.2. 调整估计器的超参数
    • 3.3. 调整类别预测的决策阈值
    • 3.4. 度量和评分: 量化预测质量
    • 3.5. 验证曲线: 绘制分数以评估模型
  • 4. 元数据路由
  • 5. 检查
    • 5.1. 部分依赖和个体条件期望图
    • 5.2. 置换特征重要性
  • 6. 可视化
  • 7. 数据集转换
    • 7.1. 管道和复合估计器
    • 7.2. 特征提取
    • 7.3. 数据预处理
    • 7.4. 缺失值填充
    • 7.5. 无监督降维
    • 7.6. 随机投影
    • 7.7. 核近似
    • 7.8. 成对度量、亲和性和核
    • 7.9. 转换预测目标 (y)
  • 8. 数据集加载工具
    • 8.1. 玩具数据集
    • 8.2. 真实世界数据集
    • 8.3. 生成的数据集
    • 8.4. 加载其他数据集
  • 9. 使用scikit-learn进行计算
    • 9.1. 计算扩展策略:大数据
    • 9.2. 计算性能
    • 9.3. 并行性、资源管理和配置
  • 10. 模型持久化
  • 11. 常见陷阱和推荐实践
  • 12. 调度
    • 12.1. 数组API支持 (实验性)
  • 13. 选择合适的估计器
  • 14. 外部资源、视频和讲座
  • 用户指南
  • 9. 使用scikit-learn进行计算

9. 使用scikit-learn进行计算#

  • 9.1. 计算扩展策略:大数据
    • 9.1.1. 使用核外学习进行实例扩展
  • 9.2. 计算性能
    • 9.2.1. 预测延迟
    • 9.2.2. 预测吞吐量
    • 9.2.3. 技巧与窍门
  • 9.3. 并行性、资源管理和配置
    • 9.3.1. 并行性
    • 9.3.2. 配置开关

上一页

8.4. 加载其他数据集

下一页

9.1. 计算扩展策略:大数据

本页

  • 显示源

© 版权所有 2007 - 2025,scikit-learn 开发者 (BSD 许可证)。