分类器Mixin#

class sklearn.base.ClassifierMixin[source]#

scikit-learn中所有分类器的Mixin类。

此Mixin定义以下功能

  • 通过estimator_type标签将估计器类型设置为"classifier";

  • 默认使用accuracy_scorescore方法。

  • 强制要求fit方法通过requires_y标签传递y,这可以通过设置分类器类型标签来实现。

更多信息请阅读用户指南

示例

>>> import numpy as np
>>> from sklearn.base import BaseEstimator, ClassifierMixin
>>> # Mixin classes should always be on the left-hand side for a correct MRO
>>> class MyEstimator(ClassifierMixin, BaseEstimator):
...     def __init__(self, *, param=1):
...         self.param = param
...     def fit(self, X, y=None):
...         self.is_fitted_ = True
...         return self
...     def predict(self, X):
...         return np.full(shape=X.shape[0], fill_value=self.param)
>>> estimator = MyEstimator(param=1)
>>> X = np.array([[1, 2], [2, 3], [3, 4]])
>>> y = np.array([1, 0, 1])
>>> estimator.fit(X, y).predict(X)
array([1, 1, 1])
>>> estimator.score(X, y)
0.66...
score(X, y, sample_weight=None)[源代码]#

返回给定测试数据和标签的平均准确率。

在多标签分类中,这是子集准确率,这是一个严格的指标,因为它要求每个样本的每个标签集都必须被正确预测。

参数:
X形状为 (n_samples, n_features) 的类数组

测试样本。

y形状为 (n_samples,) 或 (n_samples, n_outputs) 的类数组

X 的真实标签。

sample_weight形状为 (n_samples,) 的类数组,默认为 None

样本权重。

返回:
score浮点数

self.predict(X) 相对于 y 的平均准确率。