OneVsOneClassifier#

class sklearn.multiclass.OneVsOneClassifier(estimator, *, n_jobs=None)[source]#

一对一多分类策略。

此策略涉及为每个类别对拟合一个分类器。在预测时，选择获得最多投票的类别。由于它需要拟合 n_classes * (n_classes - 1) / 2 个分类器，因此由于其 O(n_classes^2) 的复杂度，此方法通常比一对多方法慢。然而，对于像核算法这样不能很好地扩展到 n_samples 的算法，此方法可能更有优势。这是因为每个单独的学习问题只涉及数据的一小部分，而一对多方法则需要完整的数据集 n_classes 次。

在用户指南中阅读更多内容。

参数:

estimator估计器对象

一个实现了 fit 方法的回归器或分类器。当传入分类器时，优先使用 decision_function，如果不可用则回退到 predict_proba。当传入回归器时，使用 predict。

n_jobsint, 默认为 None

用于计算的作业数：n_classes * ( n_classes - 1) / 2 个 OVO 问题并行计算。

None 表示 1，除非在 joblib.parallel_backend 上下文中。 -1 表示使用所有处理器。更多详细信息请参阅术语表。

属性:

estimators_包含 n_classes * (n_classes - 1) / 2 个估计器的列表: 用于预测的估计器。
classes_形状为 [n_classes] 的 numpy 数组: 包含标签的数组。
n_classes_int: 类别数量。
pairwise_indices_列表，长度 = len(estimators_)，或 None: 训练估计器时使用的样本索引。当 estimator 的 pairwise 标记为 False 时为 None。
n_features_in_int: fit 期间见到的特征数量。

0.24 版本新增。
feature_names_in_形状为 (n_features_in_,) 的 ndarray: fit 期间见到的特征名称。仅当 X 的所有特征名称均为字符串时才定义。

1.0 版本新增。

另请参阅

OneVsRestClassifier: 一对多（One-vs-all）多分类策略。
OutputCodeClassifier: （纠错）输出码多分类策略。

示例

>>> from sklearn.datasets import load_iris
>>> from sklearn.model_selection import train_test_split
>>> from sklearn.multiclass import OneVsOneClassifier
>>> from sklearn.svm import LinearSVC
>>> X, y = load_iris(return_X_y=True)
>>> X_train, X_test, y_train, y_test = train_test_split(
...     X, y, test_size=0.33, shuffle=True, random_state=0)
>>> clf = OneVsOneClassifier(
...     LinearSVC(random_state=0)).fit(X_train, y_train)
>>> clf.predict(X_test[:10])
array([2, 1, 0, 2, 0, 2, 0, 1, 1, 1])

decision_function(X)[source]#

一对一分类器的决策函数。

样本的决策值是通过将成对分类置信水平的归一化和添加到投票中计算的，以在所有类别的投票相等导致平局时区分决策值。

参数:

X形状为 (n_samples, n_features) 的类数组: 输入数据。

返回:

Y形状为 (n_samples, n_classes) 或 (n_samples,) 的类数组: 在最终估计器上调用 decision_function 的结果。

0.19 版本更改: 输出形状改为 (n_samples,) 以符合 scikit-learn 二进制分类的约定。

fit(X, y, **fit_params)[source]#

拟合底层估计器。

参数:

X形状为 (n_samples, n_features) 的 {类数组, 稀疏矩阵}: 数据。
y形状为 (n_samples,) 的类数组: 多类别目标。
**fit_params字典: 传递给每个子估计器的 estimator.fit 方法的参数。

1.4 版本新增: 仅当 enable_metadata_routing=True 时可用。更多详细信息请参阅元数据路由用户指南。

返回:

self对象: 已拟合的底层估计器。

get_metadata_routing()[source]#

获取此对象的元数据路由。

请查看用户指南了解路由机制的工作原理。

1.4 版本新增。

返回:

routingMetadataRouter: 一个封装路由信息的 MetadataRouter。

get_params(deep=True)[source]#

获取此估计器的参数。

参数:

deep布尔值，默认为 True: 如果为 True，将返回此估计器及其包含的作为估计器的子对象的参数。

返回:

params字典: 参数名称映射到其值。

partial_fit(X, y, classes=None, **partial_fit_params)[source]#

部分拟合底层估计器。

当内存不足以训练所有数据时应使用此方法。可以分多次迭代传递数据块，其中第一次调用应包含所有目标变量的数组。

参数:

X形状为 (n_samples, n_features) 的 {类数组, 稀疏矩阵}: 数据。
y形状为 (n_samples,) 的类数组: 多类别目标。
classes数组，形状 (n_classes, ): 所有 partial_fit 调用中的类别。可以通过 np.unique(y_all) 获取，其中 y_all 是整个数据集的目标向量。此参数仅在第一次调用 partial_fit 时需要，在后续调用中可以省略。
**partial_fit_params字典: 传递给每个子估计器的 estimator.partial_fit 方法的参数。

1.4 版本新增: 仅当 enable_metadata_routing=True 时可用。更多详细信息请参阅元数据路由用户指南。

返回:

self对象: 部分拟合的底层估计器。

predict(X)[source]#

估计 X 中每个样本的最佳类别标签。

这被实现为 argmax(decision_function(X), axis=1)，它将返回通过预测每个可能的类别对决策结果的估计器获得最多投票的类别标签。

参数:

X形状为 (n_samples, n_features) 的 {类数组, 稀疏矩阵}: 数据。

返回:

y形状为 [n_samples] 的 numpy 数组: 预测的多类别目标。

score(X, y, sample_weight=None)[source]#

返回给定数据和标签的准确率。

在多标签分类中，这是子集准确率，它是一个严格的指标，因为它要求每个样本的每个标签集都必须被正确预测。

参数:

X形状为 (n_samples, n_features) 的类数组: 测试样本。
y形状为 (n_samples,) 或 (n_samples, n_outputs) 的类数组: X 的真实标签。
sample_weight形状为 (n_samples,) 的类数组，默认为 None: 样本权重。

返回:

score浮点数: self.predict(X) 相对于 y 的平均准确率。

set_params(**params)[source]#

设置此估计器的参数。

此方法适用于简单估计器以及嵌套对象（例如 Pipeline）。后者具有 <component>__<parameter> 形式的参数，以便可以更新嵌套对象的每个组件。

参数:

**params字典: 估计器参数。

返回:

self估计器实例: 估计器实例。

set_partial_fit_request(*, classes: bool | None | str = '$UNCHANGED$') → OneVsOneClassifier[source]#

请求传递给 partial_fit 方法的元数据。

请注意，此方法仅在 enable_metadata_routing=True 时相关（请参阅 sklearn.set_config）。请参阅用户指南了解路由机制的工作原理。

每个参数的选项为

True: 请求元数据，如果提供则传递给 partial_fit。如果未提供元数据，则忽略该请求。
False: 不请求元数据，元估计器不会将其传递给 partial_fit。
None: 不请求元数据，如果用户提供元数据，元估计器将引发错误。
str: 元数据应使用此给定别名而非原始名称传递给元估计器。

默认值 (sklearn.utils.metadata_routing.UNCHANGED) 保留现有请求。这允许您更改某些参数的请求而不更改其他参数。

1.3 版本新增。

注意

此方法仅当此估计器用作元估计器的子估计器时才相关，例如在 Pipeline 中使用时。否则无效。

参数:

classesstr, True, False, 或 None，默认为 sklearn.utils.metadata_routing.UNCHANGED: partial_fit 方法中 classes 参数的元数据路由。

返回:

self对象: 更新后的对象。

set_score_request(*, sample_weight: bool | None | str = '$UNCHANGED$') → OneVsOneClassifier[source]#

请求传递给 score 方法的元数据。

请注意，此方法仅在 enable_metadata_routing=True 时相关（请参阅 sklearn.set_config）。请参阅用户指南了解路由机制的工作原理。

每个参数的选项为

True: 请求元数据，如果提供则传递给 score。如果未提供元数据，则忽略该请求。
False: 不请求元数据，元估计器不会将其传递给 score。
None: 不请求元数据，如果用户提供元数据，元估计器将引发错误。
str: 元数据应使用此给定别名而非原始名称传递给元估计器。

默认值 (sklearn.utils.metadata_routing.UNCHANGED) 保留现有请求。这允许您更改某些参数的请求而不更改其他参数。

1.3 版本新增。

注意

此方法仅当此估计器用作元估计器的子估计器时才相关，例如在 Pipeline 中使用时。否则无效。

参数:

sample_weightstr, True, False, 或 None，默认为 sklearn.utils.metadata_routing.UNCHANGED: score 方法中 sample_weight 参数的元数据路由。

返回:

self对象: 更新后的对象。

画廊示例#

多分类训练元估计器概述

OneVsOneClassifier#

画廊示例#

本页