sklearn.preprocessing#
用于缩放、居中、标准化、二值化等的函数。
用户指南。更多详情请参见数据预处理部分。
根据阈值对数据进行二值化(将特征值设置为0或1)。 |
|
根据任意可调用函数构建变换器。 |
|
将连续数据划分为区间。 |
|
对任意核矩阵\(K\)进行中心化。 |
|
以一对多方式对标签进行二值化。 |
|
将目标标签编码为 0 到 n_classes-1 之间的数值。 |
|
按每个特征的最大绝对值缩放每个特征。 |
|
通过将每个特征缩放至给定范围来转换特征。 |
|
在可迭代的可迭代对象和多标签格式之间进行转换。 |
|
将样本分别规范化到单位范数。 |
|
将分类特征编码为独热数值数组。 |
|
将分类特征编码为整数数组。 |
|
生成多项式和交互特征。 |
|
对特征应用幂变换,使其更接近高斯分布。 |
|
使用分位数信息转换特征。 |
|
使用对异常值稳健的统计数据来缩放特征。 |
|
为特征生成单变量 B 样条基。 |
|
通过移除均值并缩放至单位方差来标准化特征。 |
|
用于回归和分类目标的 Target Encoder。 |
|
使用附加的虚拟特征增强数据集。 |
|
对类数组或 scipy.sparse 矩阵进行布尔阈值化。 |
|
以一对多方式对标签进行二值化。 |
|
将每个特征缩放至 [-1, 1] 范围,同时不破坏稀疏性。 |
|
通过将每个特征缩放至给定范围来转换特征。 |
|
将输入向量分别缩放至单位范数(向量长度)。 |
|
参数化、单调变换,使数据更接近高斯分布。 |
|
使用分位数信息转换特征。 |
|
沿任何轴标准化数据集。 |
|
沿任何轴标准化数据集。 |