API参考#
这是scikit-learn的类和函数参考。更多详情,请参考完整用户指南,因为类和函数的原始规范可能不足以提供其用法的完整指南。有关API中重复概念的参考,请参阅常用术语和API元素词汇表。
| 对象 | 描述 | 
|---|---|
| 用于全局scikit-learn配置的上下文管理器。 | |
| 检索由 | |
| 设置全局scikit-learn配置。 | |
| 打印有用的调试信息。 | |
| scikit-learn中所有估计器的基类。 | |
| scikit-learn中所有双聚类估计器的Mixin类。 | |
| 用于通过前缀生成其自身名称的变换器的Mixin类。 | |
| scikit-learn中所有分类器的Mixin类。 | |
| scikit-learn中所有聚类估计器的Mixin类。 | |
| scikit-learn中所有密度估计器的Mixin类。 | |
| scikit-learn中所有元估计器的Mixin类。 | |
| 为简单的变换器提供 | |
| scikit-learn中所有异常检测估计器的Mixin类。 | |
| scikit-learn中所有回归估计器的Mixin类。 | |
| scikit-learn中所有变换器的Mixin类。 | |
| 使用相同的参数构造一个新的未拟合估计器。 | |
| 如果给定的估计器(可能)是分类器,则返回True。 | |
| 如果给定的估计器(可能)是聚类器,则返回True。 | |
| 如果给定的估计器(可能)是回归器,则返回True。 | |
| 如果给定的估计器(可能)是异常检测器,则返回True。 | |
| 使用等值回归或逻辑回归进行概率校准。 | |
| 计算校准曲线的真实概率和预测概率。 | |
| 校准曲线(也称为可靠性图)可视化。 | |
| 执行数据的亲和传播聚类。 | |
| 凝聚聚类。 | |
| 实现BIRCH聚类算法。 | |
| 二分K均值聚类。 | |
| 从向量数组或距离矩阵执行DBSCAN聚类。 | |
| 聚合特征。 | |
| 使用基于层次密度的聚类对数据进行聚类。 | |
| K均值聚类。 | |
| 使用平面核的均值漂移聚类。 | |
| 小批量K均值聚类。 | |
| 从向量数组估计聚类结构。 | |
| 谱双聚类(Kluger,2003)。 | |
| 将聚类应用于归一化拉普拉斯算子的投影。 | |
| 谱共聚类算法(Dhillon,2001)。 | |
| 执行数据的亲和传播聚类。 | |
| 为任意epsilon执行DBSCAN提取。 | |
| 根据Xi-steep方法自动提取集群。 | |
| 计算OPTICS可达性图。 | |
| 从向量数组或距离矩阵执行DBSCAN聚类。 | |
| 估计与均值漂移算法一起使用的带宽。 | |
| 执行K均值聚类算法。 | |
| 根据k-means++初始化n_clusters种子。 | |
| 使用平面核对数据执行均值漂移聚类。 | |
| 将聚类应用于归一化拉普拉斯算子的投影。 | |
| 基于特征矩阵的 Ward 聚类。 | |
| 将转换器应用于数组或 pandas DataFrame 的列。 | |
| 元估计器,用于对转换后的目标进行回归。 | |
| 创建一个可调用对象,用于选择要与…一起使用的列。 | |
| 根据给定的转换器构建 ColumnTransformer。 | |
| 用于检测高斯分布数据集中的异常值的对象。 | |
| 最大似然协方差估计器。 | |
| 使用 l1 正则化估计器的稀疏逆协方差估计。 | |
| 具有交叉验证选择的 l1 惩罚的稀疏逆协方差。 | |
| Ledoit-Wolf 估计器。 | |
| 最小协方差行列式 (MCD):协方差的稳健估计器。 | |
| Oracle 近似收缩估计器。 | |
| 具有收缩的协方差估计器。 | |
| 计算最大似然协方差估计器。 | |
| L1 正则化协方差估计器。 | |
| 估计收缩的 Ledoit-Wolf 协方差矩阵。 | |
| 估计收缩的 Ledoit-Wolf 协方差矩阵。 | |
| 使用 Oracle 近似收缩估计协方差。 | |
| 计算对角线上收缩的协方差矩阵。 | |
| 典型相关分析,也称为“模式 B”PLS。 | |
| 偏最小二乘转换器和回归器。 | |
| PLS 回归。 | |
| 偏最小二乘 SVD。 | |
| 删除数据主缓存中的所有内容。 | |
| 以 svmlight/libsvm 文件格式转储数据集。 | |
| 加载来自 20 个新闻组数据集的文件名和数据(分类)。 | |
| 加载并向量化 20 个新闻组数据集(分类)。 | |
| 加载加利福尼亚州住房数据集(回归)。 | |
| 加载 covertype 数据集(分类)。 | |
| 如果本地文件夹中不存在,则从 Web 获取文件。 | |
| 加载 kddcup99 数据集(分类)。 | |
| 加载野外标记面孔 (LFW) 对数据集(分类)。 | |
| 加载野外标记面孔 (LFW) 人员数据集(分类)。 | |
| 加载来自 AT&T 的 Olivetti 面部数据集(分类)。 | |
| 按名称或数据集 ID 从 openml 获取数据集。 | |
| 加载 RCV1 多标签数据集(分类)。 | |
| 加载来自 Phillips 等人 (2006) 的物种分布数据集的加载器。 | |
| 返回 scikit-learn 数据目录的路径。 | |
| 加载并返回威斯康星州乳腺癌数据集(分类)。 | |
| 加载并返回糖尿病数据集(回归)。 | |
| 加载并返回数字数据集(分类)。 | |
| 加载文本文件,类别作为子文件夹名称。 | |
| 加载并返回虹膜数据集(分类)。 | |
| 加载并返回物理运动 Linnerud 数据集。 | |
| 加载单个样本图像的 numpy 数组。 | |
| 加载用于图像处理的样本图像。 | |
| 将 svmlight/libsvm 格式的数据集加载到稀疏 CSR 矩阵中。 | |
| 从 SVMlight 格式的多个文件中加载数据集。 | |
| 加载并返回葡萄酒数据集(分类)。 | |
| 为双聚类生成常数块对角结构数组。 | |
| 为聚类生成各向同性高斯斑点。 | |
| 为双聚类生成具有块棋盘结构的数组。 | |
| 在 2D 中制作一个包含较小圆圈的大圆圈。 | |
| 生成一个随机的 n 类分类问题。 | |
| 生成“Friedman #1”回归问题。 | |
| 生成“Friedman #2”回归问题。 | |
| 生成“Friedman #3”回归问题。 | |
| 生成各向同性高斯数据并按分位数标记样本。 | |
| 生成 Hastie 等人 2009,示例 10.2 中使用的二元分类数据。 | |
| 生成一个具有钟形奇异值的主要是低秩矩阵。 | |
| 制作两个交错的半圆。 | |
| 生成一个随机的多标签分类问题。 | |
| 生成一个随机的回归问题。 | |
| 生成 S 曲线数据集。 | |
| 生成一个作为字典元素的稀疏组合的信号。 | |
| 生成一个稀疏对称正定矩阵。 | |
| 生成一个具有稀疏不相关设计的随机回归问题。 | |
| 生成一个随机的对称正定矩阵。 | |
| 生成一个瑞士卷数据集。 | |
| 字典学习。 | |
| 因子分析 (FA)。 | |
| FastICA:一种用于独立成分分析的快速算法。 | |
| 增量主成分分析 (IPCA)。 | |
| 核主成分分析 (KPCA)。 | |
| 具有在线变分贝叶斯算法的潜在狄利克雷分配。 | |
| 小批量字典学习。 | |
| 小批量非负矩阵分解 (NMF)。 | |
| 小批量稀疏主成分分析。 | |
| 非负矩阵分解 (NMF)。 | |
| 主成分分析 (PCA)。 | |
| 稀疏编码。 | |
| 稀疏主成分分析 (SparsePCA)。 | |
| 使用截断 SVD(又名 LSA)进行降维。 | |
| 求解字典学习矩阵分解问题。 | |
| 在线求解字典学习矩阵分解问题。 | |
| 执行快速独立成分分析。 | |
| 计算非负矩阵分解 (NMF)。 | |
| 稀疏编码。 | |
| 线性判别分析。 | |
| 二次判别分析。 | |
| DummyClassifier 做出忽略输入特征的预测。 | |
| 使用简单规则进行预测的回归器。 | |
| AdaBoost 分类器。 | |
| AdaBoost 回归器。 | |
| Bagging 分类器。 | |
| Bagging 回归器。 | |
| Extra-trees 分类器。 | |
| Extra-trees 回归器。 | |
| 用于分类的梯度提升。 | |
| 用于回归的梯度提升。 | |
| 基于直方图的梯度提升分类树。 | |
| 基于直方图的梯度提升回归树。 | |
| 隔离森林算法。 | |
| 随机森林分类器。 | |
| 随机森林回归器。 | |
| 完全随机树的集合。 | |
| 具有最终分类器的估计器堆栈。 | |
| 具有最终回归器的估计器堆栈。 | |
| 用于未拟合估计器的软投票/多数规则分类器。 | |
| 用于未拟合估计器的预测投票回归器。 | |
| 自定义警告,用于捕获收敛问题。 | |
| 用于通知代码中发生的隐式数据转换的警告。 | |
| 自定义警告,用于通知数据维度方面的潜在问题。 | |
| 用于通知用户计算效率低下的警告。 | |
| 如果拟合估计器时发生错误,则使用的警告类。 | |
| 当使用不一致版本的估计器进行反序列化时引发的警告。 | |
| 如果在拟合之前使用估计器,则引发的异常类。 | |
| 指标无效时使用的警告。 | |
| 当来自通用测试的估计器检查失败时引发的警告。 | |
| 启用连续减半搜索估计器。 | |
| 启用 IterativeImputer。 | |
| 将特征值映射列表转换为向量。 | |
| 实现特征哈希,又称哈希技巧。 | |
| 从图像集合中提取补丁。 | |
| 将 2D 图像重塑为补丁集合。 | |
| 像素到像素连接的图。 | |
| 像素到像素梯度连接的图。 | |
| 根据所有补丁重建图像。 | |
| 将文本文档集合转换为标记计数矩阵。 | |
| 将文本文档集合转换为标记出现次数矩阵。 | |
| 将计数矩阵转换为标准化的tf或tf-idf表示。 | |
| 将原始文档集合转换为TF-IDF特征矩阵。 | |
| 具有可配置策略的单变量特征选择器。 | |
| 使用递归特征消除进行特征排序。 | |
| 使用交叉验证的递归特征消除来选择特征。 | |
| 过滤器:选择估计的错误发现率的p值。 | |
| 过滤器:根据FPR检验选择低于alpha的p值。 | |
| 基于重要性权重选择特征的元转换器。 | |
| 过滤器:选择与家庭错误率相对应的p值。 | |
| 根据k个最高分选择特征。 | |
| 根据最高分数的百分位数选择特征。 | |
| 执行给定支持掩码的特征选择的转换器混合。 | |
| 执行顺序特征选择的转换器。 | |
| 去除所有低方差特征的特征选择器。 | |
| 计算每个非负特征和类别之间的卡方统计量。 | |
| 计算提供的样本的ANOVA F值。 | |
| 返回F统计量和p值的单变量线性回归检验。 | |
| 估计离散目标变量的互信息。 | |
| 估计连续目标变量的互信息。 | |
| 计算每个特征与目标之间的皮尔逊相关系数r。 | |
| 包装已拟合估计器的估计器,以防止重新拟合。 | |
| 基于拉普拉斯逼近的高斯过程分类 (GPC)。 | |
| 高斯过程回归 (GPR)。 | |
| 由一组其他核组成的核。 | |
| 指数正弦平方核(又名周期核)。 | |
| 指数核采用一个基核和一个标量参数。 | |
| 以命名元组形式指定的核超参数。 | |
| 所有核的基类。 | |
| sklearn.metrics.pairwise中核的包装器。 | |
| 
 | |
| 径向基函数核(又名平方指数核)。 | |
| 
 | |
| 多变量填补器,根据所有其他特征估计每个特征。 | |
| 使用k近邻完成缺失值的填补。 | |
| 缺失值的二元指示符。 | |
| 使用简单策略完成缺失值的单变量填补器。 | |
| 
 | |
| 用于特征评估的排列重要性 [Rd9e56ef97513-BRE]。 | |
| 决策边界可视化。 | |
| 局部依赖图 (PDP)。 | |
| 等距回归模型。 | |
| 确定y是否与x单调相关。 | |
| 求解等距回归模型。 | |
| 加性chi2核的近似特征映射。 | |
| 使用训练数据的子集近似核映射。 | |
| 通过张量草图进行多项式核逼近。 | |
| 使用随机傅里叶特征逼近RBF核特征映射。 | |
| “偏斜卡方”核的近似特征映射。 | |
| 核岭回归。 | |
| 逻辑回归(又名logit,MaxEnt)分类器。 | |
| 逻辑回归CV(又名logit,MaxEnt)分类器。 | |
| 被动攻击分类器。 | |
| 线性感知器分类器。 | |
| 使用岭回归的分类器。 | |
| 具有内置交叉验证的岭分类器。 | |
| 使用SGD训练的线性分类器(SVM、逻辑回归等)。 | |
| 使用随机梯度下降求解线性一类SVM。 | |
| 普通最小二乘线性回归。 | |
| 具有l2正则化的线性最小二乘法。 | |
| 具有内置交叉验证的岭回归。 | |
| 通过使用SGD最小化正则化经验损失来拟合的线性模型。 | |
| 具有组合L1和L2先验作为正则化器的线性回归。 | |
| 沿正则化路径进行迭代拟合的弹性网络模型。 | |
| 最小角回归模型,又名LAR。 | |
| 交叉验证的最小角回归模型。 | |
| 使用L1先验作为正则化器的线性模型(又名Lasso)。 | |
| 沿正则化路径进行迭代拟合的Lasso线性模型。 | |
| 使用最小角回归(又名Lars)拟合的Lasso模型。 | |
| 使用LARS算法进行交叉验证的Lasso。 | |
| 使用BIC或AIC进行模型选择的Lars拟合的Lasso模型。 | |
| 正交匹配追踪模型 (OMP)。 | |
| 交叉验证的正交匹配追踪模型 (OMP)。 | |
| 贝叶斯ARD回归。 | |
| 贝叶斯岭回归。 | |
| 使用L1/L2混合范数作为正则化器的多任务ElasticNet模型。 | |
| 具有内置交叉验证的多任务L1/L2 ElasticNet。 | |
| 使用L1/L2混合范数作为正则化器的多任务Lasso模型。 | |
| 使用L1/L2混合范数作为正则化器的多任务Lasso模型。 | |
| 对异常值具有鲁棒性的L2正则化线性回归模型。 | |
| 预测条件分位数的线性回归模型。 | |
| RANSAC(RANdom SAmple Consensus)算法。 | |
| Theil-Sen估计器:鲁棒的多元回归模型。 | |
| 具有Gamma分布的广义线性模型。 | |
| 具有泊松分布的广义线性模型。 | |
| 具有Tweedie分布的广义线性模型。 | |
| 被动攻击回归器。 | |
| 使用坐标下降计算弹性网络路径。 | |
| 使用LARS算法计算最小角回归或Lasso路径。 | |
| 充分统计模式下的lars_path。 | |
| 使用坐标下降计算Lasso路径。 | |
| 正交匹配追踪 (OMP)。 | |
| Gram正交匹配追踪 (OMP)。 | |
| 用正规方程法求解岭方程。 | |
| Isomap嵌入。 | |
| 局部线性嵌入。 | |
| 多维缩放。 | |
| 用于非线性降维的光谱嵌入。 | |
| t分布随机邻域嵌入。 | |
| 对数据执行局部线性嵌入分析。 | |
| 使用SMACOF算法计算多维缩放。 | |
| 将样本投影到图拉普拉斯算子的前几个特征向量上。 | |
| 指示局部结构保留的程度。 | |
| 根据用户选项确定评分器。 | |
| 从字符串获取评分器。 | |
| 获取所有可用评分器的名称。 | |
| 从性能指标或损失函数创建评分器。 | |
| 准确性分类得分。 | |
| 使用梯形法则计算曲线下面积 (AUC)。 | |
| 根据预测分数计算平均精度 (AP)。 | |
| 计算平衡准确率。 | |
| 计算Brier分数损失。 | |
| 计算二元分类的正负似然比。 | |
| 构建显示主要分类指标的文本报告。 | |
| 计算Cohen的kappa:衡量注释者间一致性的统计量。 | |
| 计算混淆矩阵以评估分类的准确性。 | |
| \(D^2\) 分数函数,解释的日志损失分数。 | |
| 计算折算累积增益。 | |
| 计算不同概率阈值的错误率。 | |
| 计算F1分数,也称为平衡F分数或F度量。 | |
| 计算F-beta分数。 | |
| 计算平均汉明损失。 | |
| 平均铰链损失(非正则化)。 | |
| Jaccard相似系数得分。 | |
| 对数损失,又名逻辑损失或交叉熵损失。 | |
| 计算马修斯相关系数 (MCC)。 | |
| 为每个类别或样本计算混淆矩阵。 | |
| 计算归一化折损累积增益 (NDCG)。 | |
| 计算不同概率阈值的精确率-召回率对。 | |
| 计算每个类别的精确率、召回率、F 值和支持度。 | |
| 计算精确率。 | |
| 计算召回率。 | |
| 根据预测分数计算受试者工作特征曲线下面积 (ROC AUC)。 | |
| 计算受试者工作特征曲线 (ROC)。 | |
| Top-k 准确率分类评分。 | |
| 零一分类损失。 | |
| \(D^2\) 回归评分函数,解释的绝对误差分数。 | |
| \(D^2\) 回归评分函数,解释的Pinball损失分数。 | |
| \(D^2\) 回归评分函数,解释的Tweedie偏差分数。 | |
| 解释方差回归评分函数。 | |
| max_error 指标计算最大残差误差。 | |
| 平均绝对误差回归损失。 | |
| 平均绝对百分比误差 (MAPE) 回归损失。 | |
| 平均 Gamma 偏差回归损失。 | |
| 分位数回归的 Pinball 损失。 | |
| 平均泊松偏差回归损失。 | |
| 均方误差回归损失。 | |
| 均方对数误差回归损失。 | |
| 平均 Tweedie 偏差回归损失。 | |
| 中位数绝对误差回归损失。 | |
| \(R^2\)(决定系数)回归评分函数。 | |
| 均方根误差回归损失。 | |
| 均方根对数误差回归损失。 | |
| 覆盖率误差度量。 | |
| 计算基于排名的平均精度。 | |
| 计算排名损失度量。 | |
| 两个聚类之间的调整互信息。 | |
| 经机会校正的 Rand 指数。 | |
| 计算 Calinski-Harabasz 评分。 | |
| 构建一个描述标签之间关系的列联表。 | |
| 由两个聚类产生的配对混淆矩阵。 | |
| 计算给定真实标签的聚类标签的完整性指标。 | |
| 计算 Davies-Bouldin 评分。 | |
| 衡量点集的两个聚类的相似性。 | |
| 同时计算同质性、完整性和 V-Measure 评分。 | |
| 给定真实标签的聚类标签的同质性指标。 | |
| 两个聚类之间的互信息。 | |
| 两个聚类之间的归一化互信息。 | |
| Rand 指数。 | |
| 计算每个样本的轮廓系数。 | |
| 计算所有样本的平均轮廓系数。 | |
| 给定真实标签的 V-Measure 聚类标签。 | |
| 两组双聚类的相似性。 | |
| 快速距离度量函数的统一接口。 | |
| 计算 X 和 Y 中观测值之间的加性卡方核。 | |
| 计算 X 和 Y 之间的指数卡方核。 | |
| 计算 X 和 Y 中样本之间的余弦距离。 | |
| 计算 X 和 Y 中样本之间的余弦相似度。 | |
| pairwise_distances 的有效指标。 | |
| 计算向量数组 X 和 Y 中每一对之间的距离矩阵。 | |
| 计算 X 和 Y 中样本之间的 Haversine 距离。 | |
| pairwise_kernels 的有效指标。 | |
| 计算 X 和 Y 之间的拉普拉斯核。 | |
| 计算 X 和 Y 之间的线性核。 | |
| 计算 X 和 Y 中向量之间的 L1 距离。 | |
| 在存在缺失值的情况下计算欧几里得距离。 | |
| 计算 X 和 Y 之间的成对余弦距离。 | |
| 计算 X 和 Y 之间的成对距离。 | |
| 计算 X 和 Y 之间的成对欧几里得距离。 | |
| 计算 X 和 Y 之间的成对 L1 距离。 | |
| 计算数组 X 和可选数组 Y 之间的核。 | |
| 计算 X 和 Y 之间的多项式核。 | |
| 计算 X 和 Y 之间的 RBF(高斯)核。 | |
| 计算 X 和 Y 之间的 sigmoid 核。 | |
| 根据向量数组 X 和可选的 Y 计算距离矩阵。 | |
| 计算一个点和一组点之间的最小距离。 | |
| 计算一个点和一组点之间的最小距离。 | |
| 分块生成距离矩阵,并可选地进行约简。 | |
| 混淆矩阵可视化。 | |
| DET 曲线可视化。 | |
| 精确率-召回率可视化。 | |
| 回归模型预测误差的可视化。 | |
| ROC 曲线可视化。 | |
| 高斯混合的变分贝叶斯估计。 | |
| 高斯混合。 | |
| 具有非重叠组的 K 折迭代器变体。 | |
| Shuffle-Group(s)-Out 交叉验证迭代器。 | |
| K 折交叉验证器。 | |
| 留一组出交叉验证器。 | |
| 留一法交叉验证器。 | |
| 留 P 组出交叉验证器。 | |
| 留 P 法交叉验证器。 | |
| 预定义分割交叉验证器。 | |
| 重复 K 折交叉验证器。 | |
| 重复分层 K 折交叉验证器。 | |
| 随机排列交叉验证器。 | |
| 具有非重叠组的分层 K 折迭代器变体。 | |
| 分层 K 折交叉验证器。 | |
| 分层 ShuffleSplit 交叉验证器。 | |
| 时间序列交叉验证器。 | |
| 用于构建交叉验证器的输入检查器实用程序。 | |
| 将数组或矩阵分割成随机的训练和测试子集。 | |
| 对估计器的指定参数值进行穷举搜索。 | |
| 使用连续减半搜索指定的参数值。 | |
| 超参数的随机搜索。 | |
| 参数网格,每个参数具有离散数量的值。 | |
| 从给定分布中采样参数的生成器。 | |
| 超参数的随机搜索。 | |
| 手动设置决策阈值的二元分类器。 | |
| 使用交叉验证对决策阈值进行后调优的分类器。 | |
| 为每个输入数据点生成交叉验证估计。 | |
| 通过交叉验证评估分数。 | |
| 通过交叉验证评估指标,并记录拟合/评分时间。 | |
| 使用排列评估交叉验证分数的显著性。 | |
| 学习曲线可视化。 | |
| 验证曲线可视化。 | |
| 一对一多类策略。 | |
| 一对其余 (OvR) 多类策略。 | |
| (纠错) 输出码多类策略。 | |
| 将二元分类器排列成链的多标签模型。 | |
| 多目标分类。 | |
| 多目标回归。 | |
| 将回归排列成链的多标签模型。 | |
| 用于多元伯努利模型的朴素贝叶斯分类器。 | |
| 用于分类特征的朴素贝叶斯分类器。 | |
| Rennie 等人 (2003) 描述的补充朴素贝叶斯分类器。 | |
| 高斯朴素贝叶斯 (GaussianNB)。 | |
| 用于多项式模型的朴素贝叶斯分类器。 | |
| 用于快速广义 N 点问题的 BallTree。 | |
| 用于快速广义 N 点问题的 KDTree。 | |
| 实现 k 近邻投票的分类器。 | |
| 基于 k 近邻的回归。 | |
| 将 X 转换为 k 近邻的(加权)图。 | |
| 核密度估计。 | |
| 使用局部异常因子 (LOF) 进行无监督异常检测。 | |
| 最近质心分类器。 | |
| 用于实现邻域搜索的无监督学习器。 | |
| 邻域成分分析。 | |
| 实现给定半径内邻域投票的分类器。 | |
| 基于固定半径内邻域的回归。 | |
| 将 X 转换为半径内邻域的(加权)图。 | |
| 计算 X 中点的 k 近邻的(加权)图。 | |
| 计算 X 中点的邻域的(加权)图。 | |
| 对稀疏图进行排序,以便每一行都按递增值存储。 | |
| 伯努利受限玻尔兹曼机 (RBM)。 | |
| 多层感知器分类器。 | |
| 多层感知器回归器。 | |
| 连接多个转换器对象的的结果。 | |
| 具有可选最终预测器的多个数据转换器的序列。 | |
| 根据给定的估计器构建一个  | |
| 根据给定的转换器构建一个  | |
| 根据阈值对数据进行二值化(将特征值设置为 0 或 1)。 | |
| 从任意可调用对象构建一个转换器。 | |
| 将连续数据分成区间。 | |
| 居中任意核矩阵\(K\)。 | |
| 以一对多方式二值化标签。 | |
| 使用 0 到 n_classes-1 之间的数值编码目标标签。 | |
| 按其最大绝对值缩放每个特征。 | |
| 通过将每个特征缩放至给定范围来转换特征。 | |
| 在可迭代的可迭代对象和多标签格式之间转换。 | |
| 将样本单独规范化为单位范数。 | |
| 将分类特征编码为独热数值数组。 | |
| 将分类特征编码为整数数组。 | |
| 生成多项式和交互特征。 | |
| 对特征应用幂变换,使数据更符合高斯分布。 | |
| 使用分位数信息转换特征。 | |
| 使用对异常值稳健的统计数据来缩放特征。 | |
| 为特征生成单变量 B 样条基。 | |
| 通过移除均值并缩放至单位方差来标准化特征。 | |
| 用于回归和分类目标的目标编码器。 | |
| 使用附加的虚拟特征扩充数据集。 | |
| 对类数组或 scipy.sparse 矩阵进行布尔阈值处理。 | |
| 以一对多方式二值化标签。 | |
| 将每个特征缩放至 [-1, 1] 范围,而不会破坏稀疏性。 | |
| 通过将每个特征缩放至给定范围来转换特征。 | |
| 将输入向量单独缩放至单位范数(向量长度)。 | |
| 参数化、单调变换,使数据更符合高斯分布。 | |
| 使用分位数信息转换特征。 | |
| 沿任何轴标准化数据集。 | |
| 沿任何轴标准化数据集。 | |
| 通过高斯随机投影降低维度。 | |
| 通过稀疏随机投影降低维度。 | |
| 找到一个“安全”的随机投影成分数量。 | |
| 标签传播分类器。 | |
| 用于半监督学习的 LabelSpreading 模型。 | |
| 自训练分类器。 | |
| 线性支持向量分类。 | |
| 线性支持向量回归。 | |
| Nu 支持向量分类。 | |
| Nu 支持向量回归。 | |
| 无监督异常值检测。 | |
| C 支持向量分类。 | |
| Epsilon 支持向量回归。 | |
| 返回 C 的下界。 | |
| 决策树分类器。 | |
| 决策树回归器。 | |
| 极端随机树分类器。 | |
| 极端随机树回归器。 | |
| 以 DOT 格式导出决策树。 | |
| 构建显示决策树规则的文本报告。 | |
| 绘制决策树。 | |
| 将键作为属性公开的容器对象。 | |
| 使用索引返回 X 的行、项目或列。 | |
| 将类数组转换为浮点数数组。 | |
| 如果 X 包含 NaN 或无穷大,则抛出 ValueError。 | |
| 修饰器,用于将函数或类标记为已弃用。 | |
| 构建估计器的 HTML 表示。 | |
| 生成器,用于创建包含  | |
| 生成器,用于创建  | |
| 使数组可用于交叉验证的索引。 | |
| 计算密钥在 seed 上的 32 位 murmurhash3。 | |
| 以一致的方式重新采样数组或稀疏矩阵。 | |
| 返回可在 X 上安全使用的掩码。 | |
| 类数组和稀疏矩阵的逐元素平方。 | |
| 以一致的方式洗牌数组或稀疏矩阵。 | |
| 估计器的标签。 | |
| 输入数据的标签。 | |
| 目标数据的标签。 | |
| 分类器的标签。 | |
| 回归器的标签。 | |
| 转换器的标签。 | |
| 获取估计器标签。 | |
| 标准估计器的输入验证。 | |
| 对数组、列表、稀疏矩阵或类似对象的输入验证。 | |
| 检查所有数组是否具有一致的第一维。 | |
| 将 seed 转换为 np.random.RandomState 实例。 | |
| 验证标量参数的类型和值。 | |
| 对估计器执行 is_fitted 验证。 | |
| 检查  | |
| 确保数组是二维、正方形且对称的。 | |
| 展平列或一维 numpy 数组,否则引发错误。 | |
| 检查估计器的 fit 方法是否支持给定的参数。 | |
| 验证输入数据并设置或检查输入的特征名称和计数。 | |
| 只有当检查返回真值时才可用的属性。 | |
| 为不平衡数据集估计类权重。 | |
| 按类估计不平衡数据集的样本权重。 | |
| 检查  | |
| 确定目标指示的数据类型。 | |
| 提取有序的唯一标签数组。 | |
| 计算稀疏向量的密度。 | |
| 计算方阵行列式的对数。 | |
| 计算正交矩阵,其范围近似于 A 的范围。 | |
| 计算截断随机 SVD。 | |
| 正确处理稀疏矩阵情况的点积。 | |
| 返回传递数组中加权众数(最常见值)的数组。 | |
| 沿 CSR 或 CSC 矩阵上的轴计算增量均值和方差。 | |
| 对 CSC/CSR 矩阵进行就地列缩放。 | |
| 对 CSR 矩阵进行就地列缩放。 | |
| 对 CSR 或 CSC 矩阵进行就地行缩放。 | |
| 就地交换 CSC/CSR 矩阵的两列。 | |
| 就地交换 CSC/CSR 矩阵的两行。 | |
| 沿 CSR 或 CSC 矩阵上的轴计算均值和方差。 | |
| 通过其 L1 范数就地规范化 CSR 矩阵或数组的行。 | |
| 通过其 L2 范数就地规范化 CSR 矩阵或数组的行。 | |
| 返回从源到所有可达节点的最短路径的长度。 | |
| 无放回地采样整数。 | |
| 查找数组在正值上的最小值。 | |
| 包含消费者的元数据请求信息。 | |
| 存储和处理路由器对象的元数据路由。 | |
| 存储路由器的调用者和被调用者方法之间的映射。 | |
| 从给定对象获取  | |
| 验证和路由输入参数。 | |
| 获取  | |
| 获取  | |
| 获取  | |
| 检查估计器是否符合 scikit-learn 约定。 | |
| 用于参数化估计器检查的 Pytest 特定装饰器。 | |
| 迭代地为估计器生成所有检查可调用对象。 | |
| 
 | |
| 用于捕获函数参数的装饰器。 | |
| 在 with 块内更改 Parallel 使用的默认后端。 | |
| 注册新的 Parallel 后端工厂。 | 
