目标类型#
- sklearn.utils.multiclass.type_of_target(y, input_name='', raise_unknown=False)[source]#
确定目标指示的数据类型。
请注意,此类型是可以推断出的最具体的类型。例如
binary
更具体,但与multiclass
兼容。multiclass
整数更具体,但与continuous
兼容。multilabel-indicator
更具体,但与multiclass-multioutput
兼容。
- 参数:
- y{数组、稀疏矩阵}
目标值。如果是一个稀疏矩阵,则预期
y
为 CSR/CSC 矩阵。- input_namestr,默认为“”
用于构建错误消息的数据名称。
1.1.0 版本新增。
- raise_unknownbool,默认为False
如果
True
,则当type_of_target
返回的目标类型为"unknown"
时,引发错误。1.6 版本新增。
- 返回:
- target_typestr
其中之一:
‘continuous’:
y
是一个浮点数数组,并非全是整数,并且是一维数组或列向量。‘continuous-multioutput’:
y
是一个二维浮点数数组,并非全是整数,并且两个维度的大小都大于 1。‘binary’:
y
包含 <= 2 个离散值,并且是一维数组或列向量。‘multiclass’:
y
包含超过两个离散值,不是序列的序列,并且是一维数组或列向量。‘multiclass-multioutput’:
y
是一个二维数组,包含超过两个离散值,不是序列的序列,并且两个维度的大小都大于 1。‘multilabel-indicator’:
y
是一个标签指示矩阵,一个至少有两列、最多两个唯一值的二维数组。‘unknown’:
y
是数组类型,但不是以上任何一种,例如三维数组、序列的序列或非序列对象的数组。
示例
>>> from sklearn.utils.multiclass import type_of_target >>> import numpy as np >>> type_of_target([0.1, 0.6]) 'continuous' >>> type_of_target([1, -1, -1, 1]) 'binary' >>> type_of_target(['a', 'b', 'a']) 'binary' >>> type_of_target([1.0, 2.0]) 'binary' >>> type_of_target([1, 0, 2]) 'multiclass' >>> type_of_target([1.0, 0.0, 3.0]) 'multiclass' >>> type_of_target(['a', 'b', 'c']) 'multiclass' >>> type_of_target(np.array([[1, 2], [3, 1]])) 'multiclass-multioutput' >>> type_of_target([[1, 2]]) 'multilabel-indicator' >>> type_of_target(np.array([[1.5, 2.0], [3.0, 1.6]])) 'continuous-multioutput' >>> type_of_target(np.array([[0, 1], [1, 1]])) 'multilabel-indicator'