sklearn.preprocessing#
用于缩放、居中、归一化、二值化等的方法。
用户指南。 进一步细节请参阅 数据预处理 部分。
根据阈值将数据二值化(将特征值设置为0或1)。 |
|
从任意可调用对象构造一个转换器。 |
|
将连续数据分箱到多个区间。 |
|
对任意核矩阵 \(K\) 进行中心化。 |
|
以一对多的方式对标签进行二值化。 |
|
将目标标签编码为0到n_classes-1之间的值。 |
|
根据每个特征的最大绝对值进行缩放。 |
|
通过将每个特征缩放到给定范围来转换特征。 |
|
在可迭代对象的可迭代对象和多标签格式之间进行转换。 |
|
将样本单独归一化到单位范数。 |
|
将分类特征编码为独热数值数组。 |
|
将分类特征编码为整数数组。 |
|
生成多项式和交互特征。 |
|
逐特征应用幂变换,使数据更接近高斯分布。 |
|
使用分位数信息转换特征。 |
|
使用对异常值具有鲁棒性的统计量缩放特征。 |
|
为特征生成单变量B样条基。 |
|
通过移除均值和缩放到单位方差来标准化特征。 |
|
用于回归和分类目标的Target Encoder。 |
|
为数据集添加一个额外的虚拟特征。 |
|
对类数组或scipy.sparse矩阵进行布尔阈值化。 |
|
以一对多的方式对标签进行二值化。 |
|
将每个特征缩放到 [-1, 1] 范围,同时不破坏稀疏性。 |
|
通过将每个特征缩放到给定范围来转换特征。 |
|
将输入向量单独缩放到单位范数(向量长度)。 |
|
参数化、单调变换,使数据更接近高斯分布。 |
|
使用分位数信息转换特征。 |
|
沿任意轴标准化数据集。 |
|
沿任意轴标准化数据集。 |