sklearn.utils#

各种有助于开发的实用程序。

开发者指南。 有关更多详细信息,请参阅开发者实用程序 部分。

捆绑对象

公开键作为属性的容器对象。

安全索引

使用索引返回 X 的行、项目或列。

转换为浮点数组

将类似数组转换为浮点数数组。

断言所有数值都是有限的

如果 X 包含 NaN 或无穷大,则抛出 ValueError。

标记为已弃用的装饰器

用于将函数或类标记为已弃用的装饰器。

构建估计器的 HTML 表示

构建估计器的 HTML 表示。

生成包含 batch_size 个元素的切片

生成器,用于创建包含 batch_size 个元素的切片,从 0 到 n

生成 n_packs 个均匀间隔的切片

生成器,用于创建 n_packs 个均匀间隔的切片,直到 n

使数组可用于交叉验证

使数组可用于交叉验证。

计算密钥的 32 位 murmurhash3

计算种子处的密钥的 32 位 murmurhash3。

一致地重采样数组或稀疏矩阵

以一致的方式对数组或稀疏矩阵进行重采样。

返回可安全用于 X 的掩码

返回可安全用于 X 的掩码。

安全平方运算

数组和稀疏矩阵的逐元素平方。

洗牌

以一致的方式打乱数组或稀疏矩阵。

标签

估计器的标签。

输入标签

输入数据的标签。

目标标签

目标数据的标签。

分类器标签

分类器的标签。

回归器标签

回归器的标签。

转换器标签

转换器的标签。

获取标签

获取估计器标签。

输入和参数验证#

用于验证 scikit-learn 估计器中的输入和参数的函数。

检查 X 和 y

标准估计器的输入验证。

检查数组

对数组、列表、稀疏矩阵或类似对象的输入验证。

检查一致长度

检查所有数组是否具有一致的第一个维度。

检查随机状态

将种子转换为 np.random.RandomState 实例。

检查标量

验证标量参数的类型和值。

validation.check_is_fitted

对估计器执行 is_fitted 验证。

validation.check_memory

检查memory 是否类似于 joblib.Memory。

validation.check_symmetric

确保数组是二维的、方形的且对称的。

validation.column_or_1d

展平列向量或一维 numpy 数组,否则引发错误。

validation.has_fit_parameter

检查估计器的 fit 方法是否支持给定的参数。

validation.validate_data

验证输入数据并设置或检查输入的特征名称和计数。

元估计器#

元估计器的实用程序。

metaestimators.available_if

仅当检查返回真值时才可用的属性。

基于类标签的权重处理#

用于处理基于类标签的权重的实用程序。

class_weight.compute_class_weight

估计不平衡数据集的类权重。

class_weight.compute_sample_weight

为不平衡数据集估计每个类的样本权重。

处理分类器中的多类别目标#

用于处理分类器中的多类别/多输出目标的实用程序。

multiclass.is_multilabel

检查y 是否为多标签格式。

multiclass.type_of_target

确定目标指示的数据类型。

multiclass.unique_labels

提取有序的唯一标签数组。

最佳数学运算#

用于在 scikit-learn 中执行最佳数学运算的实用程序。

extmath.density

计算稀疏向量的密度。

extmath.fast_logdet

计算方阵行列式的对数。

extmath.randomized_range_finder

计算一个正交矩阵,其范围近似于 A 的范围。

extmath.randomized_svd

计算截断的随机 SVD。

extmath.safe_sparse_dot

点积,正确处理稀疏矩阵的情况。

extmath.weighted_mode

返回传递数组中加权众数(最常见)的值的数组。

使用稀疏矩阵和数组#

用于处理稀疏矩阵和数组的实用程序集合。

sparsefuncs.incr_mean_variance_axis

在 CSR 或 CSC 矩阵上沿轴计算增量均值和方差。

sparsefuncs.inplace_column_scale

对 CSC/CSR 矩阵进行就地列缩放。

sparsefuncs.inplace_csr_column_scale

对 CSR 矩阵进行就地列缩放。

sparsefuncs.inplace_row_scale

对 CSR 或 CSC 矩阵进行就地行缩放。

sparsefuncs.inplace_swap_column

就地交换 CSC/CSR 矩阵的两列。

sparsefuncs.inplace_swap_row

就地交换 CSC/CSR 矩阵的两行。

sparsefuncs.mean_variance_axis

在 CSR 或 CSC 矩阵上沿轴计算均值和方差。

用 Cython 编写的用于处理稀疏矩阵和数组的实用程序。

sparsefuncs_fast.inplace_csr_row_normalize_l1

按其 L1 范数就地归一化 CSR 矩阵或数组的行。

sparsefuncs_fast.inplace_csr_row_normalize_l2

按其 L2 范数就地归一化 CSR 矩阵或数组的行。

使用图#

图实用程序和算法。

graph.single_source_shortest_path_length

返回从源到所有可达节点的最短路径长度。

随机采样#

随机采样的实用程序。

random.sample_without_replacement

无放回地采样整数。

对数组进行操作的辅助函数#

对数组进行操作的小型辅助函数集合。

arrayfuncs.min_pos

查找数组中正值的最小值。

元数据路由#

用于在 scikit-learn 估计器中路由元数据的实用程序。

**用户指南。**有关更多详细信息,请参阅元数据路由部分。

metadata_routing.MetadataRequest

包含消费者的元数据请求信息。

metadata_routing.MetadataRouter

存储和处理路由对象的元数据路由。

metadata_routing.MethodMapping

存储路由器对象的调用者和被调用者方法之间的映射。

metadata_routing.get_routing_for_object

从给定对象获取Metadata{Router, Request}实例。

metadata_routing.process_routing

验证和路由输入参数。

发现 scikit-learn 对象#

用于发现 scikit-learn 对象的实用程序。

discovery.all_displays

sklearn获取所有显示的列表。

discovery.all_estimators

sklearn获取所有估计器的列表。

discovery.all_functions

sklearn获取所有函数的列表。

API 兼容性检查器#

各种实用程序,用于检查估计器与 scikit-learn API 的兼容性。

estimator_checks.check_estimator

检查估计器是否符合 scikit-learn 约定。

estimator_checks.parametrize_with_checks

用于参数化估计器检查的 Pytest 特定装饰器。

estimator_checks.estimator_checks_generator

迭代地为估计器生成所有检查调用。

并行计算#

joblibthreadpoolctl工具的定制,用于 scikit-learn。

parallel.Parallel

joblib.Parallel的调整,它传播 scikit-learn 配置。

parallel.delayed

用于捕获函数参数的装饰器。