sklearn.preprocessing#

用于缩放、中心化、归一化、二值化等方法。

用户指南。 有关更多详细信息，请参阅预处理数据部分。

`Binarizer`	根据阈值将数据二值化（将特征值设置为 0 或 1）。
`FunctionTransformer`	从任意可调用对象构造转换器。
`KBinsDiscretizer`	将连续数据分成区间。
`KernelCenterer`	中心化任意核矩阵 \(K\)。
`LabelBinarizer`	以一对多方式将标签二值化。
`LabelEncoder`	使用 0 到 n_classes-1 之间的值编码目标标签。
`MaxAbsScaler`	按其最大绝对值缩放每个特征。
`MinMaxScaler`	通过将每个特征缩放到给定范围来转换特征。
`MultiLabelBinarizer`	在可迭代对象和多标签格式之间转换。
`Normalizer`	将样本单独归一化为单位范数。
`OneHotEncoder`	将分类特征编码为 one-hot 数字数组。
`OrdinalEncoder`	将分类特征编码为整数数组。
`PolynomialFeatures`	生成多项式和交互特征。
`PowerTransformer`	按特征应用幂转换以使数据更像高斯分布。
`QuantileTransformer`	使用分位数信息转换特征。
`RobustScaler`	使用对异常值鲁棒的统计量缩放特征。
`SplineTransformer`	为特征生成单变量 B-样条基。
`StandardScaler`	通过移除均值并缩放为单位方差来标准化特征。
`TargetEncoder`	用于回归和分类目标的 Target Encoder。
`add_dummy_feature`	使用额外的虚拟特征扩充数据集。
`binarize`	数组类或 scipy.sparse 矩阵的布尔阈值处理。
`label_binarize`	以一对多方式将标签二值化。
`maxabs_scale`	将每个特征缩放到 [-1, 1] 范围而不破坏稀疏性。
`minmax_scale`	通过将每个特征缩放到给定范围来转换特征。
`normalize`	将输入向量单独归一化为单位范数（向量长度）。
`power_transform`	参数化、单调转换以使数据更像高斯分布。
`quantile_transform`	使用分位数信息转换特征。
`robust_scale`	沿任何轴标准化数据集。
`scale`	沿任何轴标准化数据集。