API 参考#
这是 scikit-learn 的类和函数参考。有关更多详细信息,请参阅完整用户指南,因为类的原始规范和函数可能不足以提供有关其用途的完整指导。有关在 API 中重复的概念的参考,请参阅常见术语和 API 元素词汇表。
对象 |
描述 |
|---|---|
上下文管理器,用于临时更改 scikit-learn 的全局配置。 |
|
检索当前的 scikit-learn 配置。 |
|
设置 scikit-learn 的全局配置。 |
|
打印有用的调试信息。 |
|
scikit-learn 中所有估算器的基类。 |
|
scikit-learn 中所有双聚类估算器的 Mixin 类。 |
|
Mixin 类,用于通过添加前缀生成名称的转换器。 |
|
scikit-learn 中所有分类器的 Mixin 类。 |
|
scikit-learn 中所有聚类估算器的 Mixin 类。 |
|
scikit-learn 中所有密度估算器的 Mixin 类。 |
|
scikit-learn 中所有元估算器的 Mixin 类。 |
|
为简单转换器提供 |
|
scikit-learn 中所有异常值检测估算器的 Mixin 类。 |
|
scikit-learn 中所有回归估算器的 Mixin 类。 |
|
scikit-learn 中所有转换器的 Mixin 类。 |
|
构造具有相同参数的新未拟合估算器。 |
|
如果给定估算器(可能)是分类器,则返回 True。 |
|
如果给定估算器(可能)是聚类器,则返回 True。 |
|
如果给定估算器(可能)是回归器,则返回 True。 |
|
如果给定估算器(可能)是异常值检测器,则返回 True。 |
|
使用等渗、sigmoid 或温度缩放校准概率。 |
|
计算校准曲线的真实概率和预测概率。 |
|
校准曲线(也称为可靠性图)可视化。 |
|
执行数据的 Affinity Propagation 聚类。 |
|
Agglomerative Clustering(层次聚类)。 |
|
实现 BIRCH 聚类算法。 |
|
Bisecting K-Means 聚类。 |
|
从向量数组或距离矩阵执行 DBSCAN 聚类。 |
|
特征凝聚。 |
|
使用分层基于密度的聚类对数据进行聚类。 |
|
K-Means 聚类。 |
|
使用平坦核的 Mean Shift 聚类。 |
|
Mini-Batch K-Means 聚类。 |
|
从向量数组估计聚类结构。 |
|
谱双聚类 (Kluger, 2003) [R2af9f5762274-1]。 |
|
将聚类应用于归一化拉普拉斯算子的投影。 |
|
谱协同聚类算法 (Dhillon, 2001) [R0dd0f3306ba7-1]。 |
|
执行数据的 Affinity Propagation 聚类。 |
|
为任意 epsilon 执行 DBSCAN 提取。 |
|
根据 Xi 陡峭方法自动提取聚类。 |
|
计算 OPTICS 可达性图。 |
|
从向量数组或距离矩阵执行 DBSCAN 聚类。 |
|
估算与 mean-shift 算法一起使用的带宽。 |
|
执行 K-means 聚类算法。 |
|
根据 k-means++ 初始化 n_clusters 种子。 |
|
使用平坦核执行数据的 mean shift 聚类。 |
|
将聚类应用于归一化拉普拉斯算子的投影。 |
|
基于特征矩阵的 Ward 聚类。 |
|
将转换器应用于数组或 pandas DataFrame 的列。 |
|
用于对转换后的目标进行回归的元估算器。 |
|
创建一个可调用对象,用于选择要与以下内容一起使用的列 |
|
从给定的转换器构造一个 ColumnTransformer。 |
|
用于检测高斯分布数据集中异常值的对象。 |
|
最大似然协方差估算器。 |
|
使用 l1 惩罚估算器进行稀疏逆协方差估计。 |
|
稀疏逆协方差 w/ 交叉验证选择 l1 惩罚。 |
|
LedoitWolf 估算器。 |
|
最小协方差行列式 (MCD):协方差的鲁棒估算器。 |
|
Oracle 近似收缩估算器。 |
|
具有收缩的协方差估算器。 |
|
计算最大似然协方差估算器。 |
|
L1 惩罚协方差估算器。 |
|
估算收缩的 Ledoit-Wolf 协方差矩阵。 |
|
估算收缩的 Ledoit-Wolf 协方差矩阵。 |
|
使用 Oracle 近似收缩估算协方差。 |
|
计算对角线上收缩的协方差矩阵。 |
|
典型相关分析,也称为“模式 B”PLS。 |
|
Partial Least Squares 转换器和回归器。 |
|
PLS 回归。 |
|
Partial Least Square SVD。 |
|
删除数据主缓存的所有内容。 |
|
以 svmlight / libsvm 文件格式转储数据集。 |
|
加载 20 newsgroups 数据集(分类)的文件名和数据。 |
|
加载和向量化 20 newsgroups 数据集(分类)。 |
|
加载加州房价数据集(回归)。 |
|
加载 covertype 数据集(分类)。 |
|
如果本地文件夹中不存在,则从网络获取文件。 |
|
加载 kddcup99 数据集(分类)。 |
|
加载 Labeled Faces in the Wild (LFW) 对数据集(分类)。 |
|
加载 Labeled Faces in the Wild (LFW) 人物数据集(分类)。 |
|
从 AT&T 加载 Olivetti faces 数据集(分类)。 |
|
按名称或数据集 ID 从 openml 获取数据集。 |
|
加载 RCV1 多标签数据集(分类)。 |
|
加载来自 Phillips et. al. (2006) 的物种分布数据集。 |
|
返回 scikit-learn 数据目录的路径。 |
|
加载并返回乳腺癌威斯康星数据集(分类)。 |
|
加载并返回糖尿病数据集(回归)。 |
|
加载并返回数字数据集(分类)。 |
|
加载子文件夹名称为类别的文本文件。 |
|
加载并返回鸢尾花数据集(分类)。 |
|
加载并返回体育锻炼 Linnerud 数据集。 |
|
加载单个样本图像的 numpy 数组。 |
|
加载用于图像操作的样本图像。 |
|
将 svmlight / libsvm 格式的数据集加载到稀疏 CSR 矩阵中。 |
|
从 SVMlight 格式的多个文件加载数据集。 |
|
加载并返回葡萄酒数据集(分类)。 |
|
为双聚类生成常量块对角结构数组。 |
|
生成用于聚类的各向同性高斯斑点。 |
|
为双聚类生成具有块棋盘结构的数组。 |
|
在 2d 中创建一个包含较小圆圈的大圆圈。 |
|
生成一个随机的 n 类分类问题。 |
|
生成“Friedman #1”回归问题。 |
|
生成“Friedman #2”回归问题。 |
|
生成“Friedman #3”回归问题。 |
|
生成各向同性高斯,并按分位数标记样本。 |
|
生成 Hastie et al. 2009, Example 10.2 中使用的二元分类数据。 |
|
生成一个带有钟形奇异值的低秩矩阵。 |
|
创建两个交错的半圆。 |
|
生成一个随机的多标签分类问题。 |
|
生成一个随机回归问题。 |
|
生成 S 曲线数据集。 |
|
生成作为字典元素的稀疏组合的信号。 |
|
生成稀疏对称正定矩阵。 |
|
生成具有稀疏不相关设计的随机回归问题。 |
|
生成一个随机对称正定矩阵。 |
|
生成瑞士卷数据集。 |
|
字典学习。 |
|
因子分析 (FA)。 |
|
FastICA:用于独立成分分析的快速算法。 |
|
增量主成分分析 (IPCA)。 |
|
核主成分分析 (KPCA)。 |
|
使用在线变分贝叶斯算法的潜在狄利克雷分配。 |
|
Mini-batch 字典学习。 |
|
Mini-Batch 非负矩阵分解 (NMF)。 |
|
Mini-batch 稀疏主成分分析。 |
|
非负矩阵分解 (NMF)。 |
|
主成分分析 (PCA)。 |
|
稀疏编码。 |
|
稀疏主成分分析 (SparsePCA)。 |
|
使用截断 SVD(又名 LSA)进行降维。 |
|
解决字典学习矩阵分解问题。 |
|
在线解决字典学习矩阵分解问题。 |
|
执行快速独立成分分析。 |
|
计算非负矩阵分解 (NMF)。 |
|
稀疏编码。 |
|
线性判别分析。 |
|
二次判别分析。 |
|
DummyClassifier 做出忽略输入特征的预测。 |
|
使用简单规则进行预测的回归器。 |
|
AdaBoost 分类器。 |
|
AdaBoost 回归器。 |
|
Bagging 分类器。 |
|
Bagging 回归器。 |
|
Extra-Trees 分类器。 |
|
Extra-Trees 回归器。 |
|
用于分类的梯度提升。 |
|
用于回归的梯度提升。 |
|
基于直方图的梯度提升分类树。 |
|
基于直方图的梯度提升回归树。 |
|
Isolation Forest 算法。 |
|
随机森林分类器。 |
|
随机森林回归器。 |
|
完全随机树的集合。 |
|
带有最终分类器的估算器堆栈。 |
|
带有最终回归器的估算器堆栈。 |
|
未拟合估算器的软投票/多数规则分类器。 |
|
未拟合估算器的预测投票回归器。 |
|
自定义警告以捕获收敛问题 |
|
用于通知代码中发生隐式数据转换的警告。 |
|
用于通知数据维度潜在问题的自定义警告。 |
|
用于通知用户计算效率低下的警告。 |
|
如果在拟合估算器时发生错误,则使用的警告类。 |
|
当估算器以不一致的版本解封时引发的警告。 |
|
如果在拟合前使用估算器,则引发的异常类。 |
|
当度量无效时引发的警告 |
|
当通用测试中的估算器检查失败时引发的警告。 |
|
启用 Successive Halving 搜索估算器 |
|
启用 IterativeImputer |
|
将特征值映射列表转换为向量。 |
|
实现特征哈希,又名哈希技巧。 |
|
从图像集合中提取补丁。 |
|
将 2D 图像重塑为补丁集合。 |
|
像素到像素连接的图。 |
|
像素到像素梯度连接的图。 |
|
从其所有补丁重建图像。 |
|
将文本文档集合转换为标记计数矩阵。 |
|
将文本文档集合转换为标记出现矩阵。 |
|
将计数矩阵转换为归一化的 tf 或 tf-idf 表示。 |
|
将原始文档集合转换为 TF-IDF 特征矩阵。 |
|
具有可配置策略的单变量特征选择器。 |
|
具有递归特征消除的特征排名。 |
|
具有交叉验证的递归特征消除以选择特征。 |
|
过滤器:为估算的错误发现率选择 p 值。 |
|
过滤器:根据 FPR 测试选择低于 alpha 的 p 值。 |
|
基于重要性权重选择特征的元转换器。 |
|
过滤器:选择对应于家庭误差率的 p 值。 |
|
根据 k 个最高分数选择特征。 |
|
根据最高分数的百分位数选择特征。 |
|
转换器 Mixin,根据支持掩码执行特征选择 |
|
执行顺序特征选择的转换器。 |
|
移除所有低方差特征的特征选择器。 |
|
计算每个非负特征和类之间的卡方统计量。 |
|
计算所提供样本的 ANOVA F 值。 |
|
返回 F 统计量和 p 值的单变量线性回归测试。 |
|
估计离散目标变量的互信息。 |
|
估计连续目标变量的互信息。 |
|
计算每个特征和目标的 Pearson's r。 |
|
包装已拟合估算器以防止重新拟合的估算器。 |
|
基于拉普拉斯近似的高斯过程分类 (GPC)。 |
|
高斯过程回归 (GPR)。 |
|
由一组其他核组成的核。 |
|
Exp-Sine-Squared 核(又名周期性核)。 |
|
Exponentiation 核采用一个基本核和一个标量参数 |
|
核超参数的规范,以命名元组的形式。 |
|
所有核的基类。 |
|
Matern 核。 |
|
sklearn.metrics.pairwise 中核的包装器。 |
|
|
|
径向基函数核(又名平方指数核)。 |
|
Rational Quadratic 核。 |
|
|
|
White 核。 |
|
多元插补器,从所有其他特征估计每个特征。 |
|
使用 k-Nearest Neighbors 完成缺失值的插补。 |
|
缺失值的二进制指示符。 |
|
使用简单策略完成缺失值的单变量插补器。 |
|
|
|
用于特征评估的置换重要性 [Rd9e56ef97513-BRE]。 |
|
决策边界可视化。 |
|
部分依赖图 (PDP) 和个体条件期望 (ICE)。 |
|
等渗回归模型。 |
|
确定 y 是否与 x 单调相关。 |
|
求解等渗回归模型。 |
|
加性卡方核的近似特征图。 |
|
使用训练数据的子集近似核图。 |
|
通过张量草图近似多项式核。 |
|
使用随机傅里叶特征近似 RBF 核特征图。 |
|
“偏斜卡方”核的近似特征图。 |
|
核岭回归。 |
|
Logistic 回归(又名 logit,MaxEnt)分类器。 |
|
Logistic 回归 CV(又名 logit,MaxEnt)分类器。 |
|
Passive Aggressive 分类器。 |
|
线性感知器分类器。 |
|
使用 Ridge 回归的分类器。 |
|
具有内置交叉验证的 Ridge 分类器。 |
|
具有 SGD 训练的线性分类器(SVM、logistic 回归等)。 |
|
使用随机梯度下降求解线性 One-Class SVM。 |
|
普通最小二乘线性回归。 |
|
具有 l2 正则化的线性最小二乘。 |
|
具有内置交叉验证的 Ridge 回归。 |
|
通过使用 SGD 最小化正则化经验损失来拟合的线性模型。 |
|
具有组合 L1 和 L2 先验作为正则化项的线性回归。 |
|
具有沿正则化路径迭代拟合的 Elastic Net 模型。 |
|
最小角回归模型,又名 LAR。 |
|
交叉验证的最小角回归模型。 |
|
使用 L1 先验作为正则化项训练的线性模型(又名 Lasso)。 |
|
具有沿正则化路径迭代拟合的 Lasso 线性模型。 |
|
使用最小角回归(又名 Lars)拟合的 Lasso 模型。 |
|
使用 LARS 算法的交叉验证 Lasso。 |
|
使用 BIC 或 AIC 进行模型选择的 Lars 拟合 Lasso 模型。 |
|
正交匹配追踪模型 (OMP)。 |
|
交叉验证的正交匹配追踪模型 (OMP)。 |
|
贝叶斯 ARD 回归。 |
|
贝叶斯岭回归。 |
|
使用 L1/L2 混合范数作为正则化项训练的多任务 ElasticNet 模型。 |
|
具有内置交叉验证的多任务 L1/L2 ElasticNet。 |
|
使用 L1/L2 混合范数作为正则化项训练的多任务 Lasso 模型。 |
|
使用 L1/L2 混合范数作为正则化项训练的多任务 Lasso 模型。 |
|
对异常值鲁棒的 L2 正则化线性回归模型。 |
|
预测条件分位数的线性回归模型。 |
|
RANSAC (RANdom SAmple Consensus) 算法。 |
|
Theil-Sen 估算器:鲁棒多元回归模型。 |
|
具有 Gamma 分布的广义线性模型。 |
|
具有 Poisson 分布的广义线性模型。 |
|
具有 Tweedie 分布的广义线性模型。 |
|
Passive Aggressive 回归器。 |
|
使用坐标下降计算 elastic net 路径。 |
|
使用 LARS 算法计算最小角回归或 Lasso 路径。 |
|
足够统计模式下的 lars_path。 |
|
使用坐标下降计算 Lasso 路径。 |
|
正交匹配追踪 (OMP)。 |
|
Gram 正交匹配追踪 (OMP)。 |
|
通过正规方程组方法求解岭方程。 |
|
经典多维缩放 (MDS)。 |
|
Isomap 嵌入。 |
|
局部线性嵌入。 |
|
多维缩放。 |
|
用于非线性降维的谱嵌入。 |
|
T 分布随机邻居嵌入。 |
|
对数据执行局部线性嵌入分析。 |
|
使用 SMACOF 算法计算多维缩放。 |
|
将样本投影到图拉普拉斯算子的第一个特征向量上。 |
|
指示保留局部结构的程度。 |
|
根据用户选项确定评分器。 |
|
从字符串获取评分器。 |
|
获取所有可用评分器的名称。 |
|
从性能指标或损失函数创建评分器。 |
|
准确度分类分数。 |
|
使用梯形规则计算曲线下面积 (AUC)。 |
|
从预测分数计算平均精度 (AP)。 |
|
计算平衡准确度。 |
|
计算 Brier 分数损失。 |
|
计算二元分类的正负似然比。 |
|
生成显示主要分类指标的文本报告。 |
|
计算 Cohen's kappa:衡量注释者间一致性的统计量。 |
|
计算混淆矩阵以评估分类的准确性。 |
|
计算每个分类阈值的二元混淆矩阵项。 |
|
\(D^2\) 分数函数,Brier 分数解释的比例。 |
|
\(D^2\) 分数函数,log loss 解释的比例。 |
|
计算折现累积增益。 |
|
计算不同概率阈值的检测错误权衡 (DET)。 |
|
计算 F1 分数,也称为平衡 F 分数或 F-measure。 |
|
计算 F-beta 分数。 |
|
计算平均 Hamming 损失。 |
|
平均铰链损失(非正则化)。 |
|
Jaccard 相似系数分数。 |
|
Log loss,又名 logistic loss 或交叉熵损失。 |
|
计算 Matthews 相关系数 (MCC)。 |
|
计算每个类别或样本的混淆矩阵。 |
|
计算归一化折现累积增益。 |
|
计算不同概率阈值的精确度-召回率对。 |
|
计算每个类别的精确度、召回率、F-measure 和支持度。 |
|
计算精确度。 |
|
计算召回率。 |
|
从预测分数计算接收者操作特征曲线下面积 (ROC AUC)。 |
|
计算接收者操作特征 (ROC)。 |
|
Top-k 准确度分类分数。 |
|
零一分类损失。 |
|
\(D^2\) 回归分数函数,绝对误差解释的比例。 |
|
\(D^2\) 回归分数函数,pinball loss 解释的比例。 |
|
\(D^2\) 回归分数函数,Tweedie 偏差解释的比例。 |
|
解释方差回归分数函数。 |
|
max_error 指标计算最大残差。 |
|
平均绝对误差回归损失。 |
|
平均绝对百分比误差 (MAPE) 回归损失。 |
|
平均 Gamma 偏差回归损失。 |
|
分位数回归的 Pinball loss。 |
|
平均 Poisson 偏差回归损失。 |
|
均方误差回归损失。 |
|
均方对数误差回归损失。 |
|
平均 Tweedie 偏差回归损失。 |
|
中位数绝对误差回归损失。 |
|
\(R^2\)(决定系数)回归分数函数。 |
|
均方根误差回归损失。 |
|
均方根对数误差回归损失。 |
|
覆盖率误差度量。 |
|
计算基于排名的平均精度。 |
|
计算排名损失度量。 |
|
两个聚类之间的调整互信息。 |
|
经过机会调整的 Rand index。 |
|
计算 Calinski and Harabasz 分数。 |
|
构建描述标签之间关系的列联矩阵。 |
|
来自两个聚类的对混淆矩阵。 |
|
计算给定地面实况的聚类标签的完整性指标。 |
|
计算 Davies-Bouldin 分数。 |
|
衡量一组点的两个聚类的相似性。 |
|
同时计算同质性、完整性和 V-measure 分数。 |
|
给定地面实况的聚类标签的同质性指标。 |
|
两个聚类之间的互信息。 |
|
两个聚类之间的归一化互信息。 |
|
Rand index。 |
|
计算每个样本的 Silhouette 系数。 |
|
计算所有样本的平均 Silhouette 系数。 |
|
给定地面实况的 V-measure 聚类标签。 |
|
两组双聚类的相似性。 |
|
用于快速距离度量函数的统一接口。 |
|
计算 X 和 Y 中的观测值之间的加性卡方核。 |
|
计算 X 和 Y 之间的指数卡方核。 |
|
计算 X 和 Y 中的样本之间的余弦距离。 |
|
计算 X 和 Y 中的样本之间的余弦相似度。 |
|
pairwise_distances 的有效指标。 |
|
计算特征数组 X 和 Y 中每对之间的距离矩阵。 |
|
计算 X 和 Y 中的样本之间的 Haversine 距离。 |
|
pairwise_kernels 的有效指标。 |
|
计算 X 和 Y 之间的拉普拉斯核。 |
|
计算 X 和 Y 之间的线性核。 |
|
计算 X 和 Y 中向量之间的 L1 距离。 |
|
计算存在缺失值时的欧几里得距离。 |
|
计算 X 和 Y 之间的成对余弦距离。 |
|
计算 X 和 Y 之间的成对距离。 |
|
计算 X 和 Y 之间的成对欧几里得距离。 |
|
计算 X 和 Y 之间的成对 L1 距离。 |
|
计算数组 X 和可选数组 Y 之间的核。 |
|
计算 X 和 Y 之间的多项式核。 |
|
计算 X 和 Y 之间的 rbf(高斯)核。 |
|
计算 X 和 Y 之间的 sigmoid 核。 |
|
计算特征数组 X 和可选 Y 的距离矩阵。 |
|
计算一个点与一组点之间的最小距离。 |
|
计算一个点与一组点之间的最小距离。 |
|
按块生成距离矩阵,并带有可选的缩减。 |
|
混淆矩阵可视化。 |
|
检测错误权衡 (DET) 曲线可视化。 |
|
精确度-召回率可视化。 |
|
回归模型预测误差的可视化。 |
|
ROC 曲线可视化。 |
|
高斯混合的变分贝叶斯估计。 |
|
高斯混合。 |
|
具有非重叠组的 K 折迭代器变体。 |
|
Shuffle-Group(s)-Out 交叉验证迭代器。 |
|
K-Fold 交叉验证器。 |
|
Leave One Group Out 交叉验证器。 |
|
Leave-One-Out 交叉验证器。 |
|
Leave P Group(s) Out 交叉验证器。 |
|
Leave-P-Out 交叉验证器。 |
|
预定义拆分交叉验证器。 |
|
重复 K-Fold 交叉验证器。 |
|
重复分层 K-Fold 交叉验证器。 |
|
随机置换交叉验证器。 |
|
具有非重叠组的分层 K-Fold 迭代器变体。 |
|
分层 K-Fold 交叉验证器。 |
|
分层 ShuffleSplit 交叉验证器。 |
|
时间序列交叉验证器。 |
|
用于构建交叉验证器的输入检查实用程序。 |
|
将数组或矩阵拆分为随机训练集和测试子集。 |
|
对估算器的指定参数值进行穷举搜索。 |
|
使用 Successive Halving 对指定参数值进行搜索。 |
|
对超参数进行随机搜索。 |
|
每个参数具有离散数量值的参数网格。 |
|
从给定分布中采样的参数生成器。 |
|
对超参数进行随机搜索。 |
|
手动设置决策阈值的二元分类器。 |
|
使用交叉验证对决策阈值进行后调整的分类器。 |
|
为每个输入数据点生成交叉验证估计。 |
|
通过交叉验证评估分数。 |
|
通过交叉验证评估指标,并记录拟合/评分时间。 |
|
学习曲线。 |
|
使用置换评估交叉验证分数的显著性。 |
|
验证曲线。 |
|
学习曲线可视化。 |
|
验证曲线可视化。 |
|
一对一多类策略。 |
|
一对多 (OvR) 多类策略。 |
|
(纠错)输出代码多类策略。 |
|
将二元分类器排列成链的多标签模型。 |
|
多目标分类。 |
|
多目标回归。 |
|
将回归器排列成链的多标签模型。 |
|
用于多元伯努利模型的朴素贝叶斯分类器。 |
|
用于分类特征的朴素贝叶斯分类器。 |
|
Rennie et al. (2003) 中描述的 Complement Naive Bayes 分类器。 |
|
高斯朴素贝叶斯 (GaussianNB)。 |
|
用于多项式模型的朴素贝叶斯分类器。 |
|
用于快速广义 N 点问题的 BallTree |
|
用于快速广义 N 点问题的 KDTree |
|
实现 k 最近邻投票的分类器。 |
|
基于 k 最近邻的回归。 |
|
将 X 转换为 k 最近邻的(加权)图。 |
|
核密度估计。 |
|
使用局部异常因子 (LOF) 进行无监督异常值检测。 |
|
最近质心分类器。 |
|
用于实现邻居搜索的无监督学习器。 |
|
邻域成分分析。 |
|
实现给定半径内邻居投票的分类器。 |
|
基于固定半径内邻居的回归。 |
|
将 X 转换为比半径更近的邻居的(加权)图。 |
|
计算 X 中点的 k-Neighbors(加权)图。 |
|
计算 X 中点的 Neighbors(加权)图。 |
|
对稀疏图进行排序,使每行以递增值存储。 |
|
伯努利受限玻尔兹曼机 (RBM)。 |
|
多层感知器分类器。 |
|
多层感知器回归器。 |
|
连接多个转换器对象的结果。 |
|
具有可选最终预测器的数据转换器序列。 |
|
从给定估算器构造一个 |
|
从给定转换器构造一个 |
|
根据阈值将数据二值化(将特征值设置为 0 或 1)。 |
|
从任意可调用对象构造转换器。 |
|
将连续数据分成区间。 |
|
中心化任意核矩阵 \(K\)。 |
|
以一对多方式将标签二值化。 |
|
使用 0 到 n_classes-1 之间的值编码目标标签。 |
|
按其最大绝对值缩放每个特征。 |
|
通过将每个特征缩放到给定范围来转换特征。 |
|
在可迭代对象和多标签格式之间转换。 |
|
将样本单独归一化为单位范数。 |
|
将分类特征编码为 one-hot 数字数组。 |
|
将分类特征编码为整数数组。 |
|
生成多项式和交互特征。 |
|
按特征应用幂转换以使数据更像高斯分布。 |
|
使用分位数信息转换特征。 |
|
使用对异常值鲁棒的统计量缩放特征。 |
|
为特征生成单变量 B-样条基。 |
|
通过移除均值并缩放为单位方差来标准化特征。 |
|
用于回归和分类目标的 Target Encoder。 |
|
使用额外的虚拟特征扩充数据集。 |
|
数组类或 scipy.sparse 矩阵的布尔阈值处理。 |
|
以一对多方式将标签二值化。 |
|
将每个特征缩放到 [-1, 1] 范围而不破坏稀疏性。 |
|
通过将每个特征缩放到给定范围来转换特征。 |
|
将输入向量单独归一化为单位范数(向量长度)。 |
|
参数化、单调转换以使数据更像高斯分布。 |
|
使用分位数信息转换特征。 |
|
沿任何轴标准化数据集。 |
|
沿任何轴标准化数据集。 |
|
通过高斯随机投影降低维度。 |
|
通过稀疏随机投影降低维度。 |
|
查找要随机投影到的“安全”组件数。 |
|
标签传播分类器。 |
|
用于半监督学习的 LabelSpreading 模型。 |
|
自训练分类器。 |
|
线性支持向量分类。 |
|
线性支持向量回归。 |
|
Nu-支持向量分类。 |
|
Nu 支持向量回归。 |
|
无监督异常值检测。 |
|
C-支持向量分类。 |
|
Epsilon-支持向量回归。 |
|
返回 |
|
决策树分类器。 |
|
决策树回归器。 |
|
非常随机的树分类器。 |
|
非常随机的树回归器。 |
|
以 DOT 格式导出决策树。 |
|
生成显示决策树规则的文本报告。 |
|
绘制决策树。 |
|
将键公开为属性的容器对象。 |
|
使用索引返回 X 的行、项或列。 |
|
将数组类对象转换为浮点数数组。 |
|
如果 X 包含 NaN 或无穷大,则引发 ValueError。 |
|
将函数或类标记为已弃用的装饰器。 |
|
构建估算器的 HTML 表示形式。 |
|
生成器,用于创建包含 |
|
生成器,用于创建 |
|
使数组可用于交叉验证的索引。 |
|
计算 key 在 seed 上的 32 位 murmurhash3。 |
|
以一致的方式重新采样数组或稀疏矩阵。 |
|
返回可安全用于 X 的掩码。 |
|
数组类和稀疏矩阵的元素级平方。 |
|
以一致的方式打乱数组或稀疏矩阵。 |
|
估算器的标签。 |
|
输入数据的标签。 |
|
目标数据的标签。 |
|
分类器的标签。 |
|
回归器的标签。 |
|
转换器的标签。 |
|
获取估算器标签。 |
|
标准估算器的输入验证。 |
|
对数组、列表、稀疏矩阵或类似对象的输入验证。 |
|
检查所有数组是否具有一致的第一维。 |
|
将种子转换为 np.random.RandomState 实例。 |
|
验证标量参数类型和值。 |
|
对估算器执行 is_fitted 验证。 |
|
检查 |
|
确保数组是 2D、正方形和对称的。 |
|
展平列或 1d numpy 数组,否则引发错误。 |
|
检查估算器的 fit 方法是否支持给定参数。 |
|
验证输入数据并设置或检查输入特征名称和计数。 |
|
仅当检查返回真值时才可用的属性。 |
|
估算不平衡数据集的类别权重。 |
|
估算不平衡数据集的按类别样本权重。 |
|
检查 |
|
确定目标指示的数据类型。 |
|
提取唯一的有序标签数组。 |
|
计算稀疏向量的密度。 |
|
计算方阵行列式的对数。 |
|
计算一个正交矩阵,其范围近似于 A 的范围。 |
|
计算截断随机 SVD。 |
|
正确处理稀疏矩阵情况的点积。 |
|
返回传入数组中加权众数(最常见)值的数组。 |
|
沿 CSR 或 CSC 矩阵的轴计算增量均值和方差。 |
|
CSC/CSR 矩阵的就地列缩放。 |
|
CSR 矩阵的就地列缩放。 |
|
CSR 或 CSC 矩阵的就地行缩放。 |
|
就地交换 CSC/CSR 矩阵的两列。 |
|
就地交换 CSC/CSR 矩阵的两行。 |
|
沿 CSR 或 CSC 矩阵的轴计算均值和方差。 |
|
将 CSR 矩阵或数组的行就地归一化为 L1 范数。 |
|
将 CSR 矩阵或数组的行就地归一化为 L2 范数。 |
|
返回从源到所有可达节点的shortest path length。 |
|
不放回地抽取整数样本。 |
|
查找数组中正值的最小值。 |
|
包含使用者的元数据请求信息。 |
|
协调 router 对象的元数据路由。 |
|
存储 router 的调用者和被调用者方法之间的映射。 |
|
从给定对象获取 |
|
验证和路由元数据。 |
|
从 |
|
从 |
|
从 |
|
检查估算器是否符合 scikit-learn 约定。 |
|
用于参数化估算器检查的 pytest 特定装饰器。 |
|
迭代地生成估算器的所有可调用检查。 |
|
|
|
用于捕获函数参数的装饰器。 |