LabelEncoder#
- class sklearn.preprocessing.LabelEncoder[source]#
将目标标签编码为介于 0 和 n_classes-1 之间的值。
此转换器应仅用于编码目标值,即
y
,而非输入X
。更多信息请参阅用户指南。
0.12 版本新增。
- 属性:
- classes_形状为 (n_classes,) 的 ndarray
保存每个类别的标签。
另请参阅
OrdinalEncoder
使用序数编码方案编码分类特征。
OneHotEncoder
将分类特征编码为独热数值数组。
示例
LabelEncoder
可用于规范化标签。>>> from sklearn.preprocessing import LabelEncoder >>> le = LabelEncoder() >>> le.fit([1, 2, 2, 6]) LabelEncoder() >>> le.classes_ array([1, 2, 6]) >>> le.transform([1, 1, 2, 6]) array([0, 0, 1, 2]...) >>> le.inverse_transform([0, 0, 1, 2]) array([1, 1, 2, 6])
它还可以将非数值标签(只要它们是可哈希和可比较的)转换为数值标签。
>>> le = LabelEncoder() >>> le.fit(["paris", "paris", "tokyo", "amsterdam"]) LabelEncoder() >>> list(le.classes_) [np.str_('amsterdam'), np.str_('paris'), np.str_('tokyo')] >>> le.transform(["tokyo", "tokyo", "paris"]) array([2, 2, 1]...) >>> list(le.inverse_transform([2, 2, 1])) [np.str_('tokyo'), np.str_('tokyo'), np.str_('paris')]
- fit_transform(y)[source]#
拟合标签编码器并返回编码后的标签。
- 参数:
- y形状为 (n_samples,) 的类数组
目标值。
- 返回:
- y形状为 (n_samples,) 的类数组
编码后的标签。
- get_metadata_routing()[source]#
获取此对象的元数据路由。
请查阅用户指南以了解路由机制的工作原理。
- 返回:
- routingMetadataRequest
一个封装路由信息的
MetadataRequest
。
- get_params(deep=True)[source]#
获取此估计器的参数。
- 参数:
- deep布尔值,默认为 True
如果为 True,则返回此估计器及其包含的作为估计器的子对象的参数。
- 返回:
- params字典
参数名称与其值映射。
- inverse_transform(y)[source]#
将标签转换回原始编码。
- 参数:
- y形状为 (n_samples,) 的类数组
目标值。
- 返回:
- y_original形状为 (n_samples,) 的 ndarray
原始编码。
- set_output(*, transform=None)[source]#
设置输出容器。
有关如何使用此 API 的示例,请参阅引入 set_output API。
- 参数:
- transform{“default”, “pandas”, “polars”},默认为 None
配置
transform
和fit_transform
的输出。"default"
: 转换器的默认输出格式"pandas"
: DataFrame 输出"polars"
: Polars 输出None
: 转换配置不变
1.4 版本新增:添加了
"polars"
选项。
- 返回:
- self估计器实例
估计器实例。