LabelEncoder#
- class sklearn.preprocessing.LabelEncoder[source]#
使用 0 到 n_classes-1 之间的值编码目标标签。
此转换器应仅用于编码目标值(即
y),而不是输入X。在 用户指南 中了解更多。
添加于 0.12 版本。
- 属性:
- classes_ndarray of shape (n_classes,)
保存每个类的标签。
另请参阅
OrdinalEncoder使用序数编码方案编码分类特征。
OneHotEncoder将分类特征编码为 one-hot 数字数组。
示例
LabelEncoder可用于规范化标签。>>> from sklearn.preprocessing import LabelEncoder >>> le = LabelEncoder() >>> le.fit([1, 2, 2, 6]) LabelEncoder() >>> le.classes_ array([1, 2, 6]) >>> le.transform([1, 1, 2, 6]) array([0, 0, 1, 2]...) >>> le.inverse_transform([0, 0, 1, 2]) array([1, 1, 2, 6])
它还可以用于将非数字标签(只要它们是可哈希和可比较的)转换为数字标签。
>>> le = LabelEncoder() >>> le.fit(["paris", "paris", "tokyo", "amsterdam"]) LabelEncoder() >>> list(le.classes_) [np.str_('amsterdam'), np.str_('paris'), np.str_('tokyo')] >>> le.transform(["tokyo", "tokyo", "paris"]) array([2, 2, 1]...) >>> list(le.inverse_transform([2, 2, 1])) [np.str_('tokyo'), np.str_('tokyo'), np.str_('paris')]
- fit_transform(y)[source]#
拟合标签编码器并返回编码后的标签。
- 参数:
- yarray-like of shape (n_samples,)
目标值。
- 返回:
- yarray-like of shape (n_samples,)
编码后的标签。
- get_metadata_routing()[source]#
获取此对象的元数据路由。
请查阅 用户指南,了解路由机制如何工作。
- 返回:
- routingMetadataRequest
封装路由信息的
MetadataRequest。
- get_params(deep=True)[source]#
获取此估计器的参数。
- 参数:
- deepbool, default=True
如果为 True,将返回此估计器以及包含的子对象(如果它们是估计器)的参数。
- 返回:
- paramsdict
参数名称映射到其值。
- inverse_transform(y)[source]#
将标签转换回原始编码。
- 参数:
- yarray-like of shape (n_samples,)
目标值。
- 返回:
- y_original形状为 (n_samples,) 的 ndarray
原始编码。
- set_output(*, transform=None)[source]#
设置输出容器。
有关如何使用 API 的示例,请参阅引入 set_output API。
- 参数:
- transform{“default”, “pandas”, “polars”}, default=None
配置
transform和fit_transform的输出。"default": 转换器的默认输出格式"pandas": DataFrame 输出"polars": Polars 输出None: 转换配置保持不变
1.4 版本新增: 添加了
"polars"选项。
- 返回:
- selfestimator instance
估计器实例。