sklearn.preprocessing#

用于缩放、中心化、归一化、二值化等方法。

用户指南。 有关更多详细信息,请参阅 预处理数据 部分。

Binarizer

根据阈值将数据二值化(将特征值设置为 0 或 1)。

FunctionTransformer

从任意可调用对象构造转换器。

KBinsDiscretizer

将连续数据分成区间。

KernelCenterer

中心化任意核矩阵 \(K\)

LabelBinarizer

以一对多方式将标签二值化。

LabelEncoder

使用 0 到 n_classes-1 之间的值编码目标标签。

MaxAbsScaler

按其最大绝对值缩放每个特征。

MinMaxScaler

通过将每个特征缩放到给定范围来转换特征。

MultiLabelBinarizer

在可迭代对象和多标签格式之间转换。

Normalizer

将样本单独归一化为单位范数。

OneHotEncoder

将分类特征编码为 one-hot 数字数组。

OrdinalEncoder

将分类特征编码为整数数组。

PolynomialFeatures

生成多项式和交互特征。

PowerTransformer

按特征应用幂转换以使数据更像高斯分布。

QuantileTransformer

使用分位数信息转换特征。

RobustScaler

使用对异常值鲁棒的统计量缩放特征。

SplineTransformer

为特征生成单变量 B-样条基。

StandardScaler

通过移除均值并缩放为单位方差来标准化特征。

TargetEncoder

用于回归和分类目标的 Target Encoder。

add_dummy_feature

使用额外的虚拟特征扩充数据集。

binarize

数组类或 scipy.sparse 矩阵的布尔阈值处理。

label_binarize

以一对多方式将标签二值化。

maxabs_scale

将每个特征缩放到 [-1, 1] 范围而不破坏稀疏性。

minmax_scale

通过将每个特征缩放到给定范围来转换特征。

normalize

将输入向量单独归一化为单位范数(向量长度)。

power_transform

参数化、单调转换以使数据更像高斯分布。

quantile_transform

使用分位数信息转换特征。

robust_scale

沿任何轴标准化数据集。

scale

沿任何轴标准化数据集。