normalize#

sklearn.preprocessing.normalize(X, norm='l2', *, axis=1, copy=True, return_norm=False)[source]#

将输入向量单独缩放为单位范数（向量长度）。

在用户指南中阅读更多信息。

参数：

X形状为 (n_samples, n_features) 的{类数组, 稀疏矩阵}: 要逐个元素归一化的数据。scipy.sparse 矩阵应采用 CSR 格式，以避免不必要的复制。
norm{‘l1’, ‘l2’, ‘max’}，默认值=’l2’: 用于归一化每个非零样本（如果轴为 0，则归一化每个非零特征）的范数。
axis{0, 1}，默认值=1: 定义用于沿其归一化数据的轴。如果为 1，则独立归一化每个样本；否则（如果为 0），则归一化每个特征。
copy布尔值，默认值=True: 如果为 False，则尝试避免复制并就地归一化。这不保证始终就地工作；例如，如果数据是具有 int dtype 的 numpy 数组，则即使 copy=False 也会返回副本。
return_norm布尔值，默认值=False: 是否返回计算出的范数。

返回：

X形状为 (n_samples, n_features) 的{ndarray, 稀疏矩阵}: 归一化的输入 X。
norms如果 axis=1 则形状为 (n_samples, )，否则为 (n_features, ) 的 ndarray: X 沿给定轴的范数数组。当 X 是稀疏矩阵时，对于范数‘l1’或‘l2’将引发 NotImplementedError。

另请参阅

Normalizer: 使用 Transformer API 执行归一化（例如，作为预处理Pipeline的一部分）。

备注

有关不同缩放器、转换器和归一化器的比较，请参阅：比较不同缩放器对含有离群值数据的影响。

示例

>>> from sklearn.preprocessing import normalize
>>> X = [[-2, 1, 2], [-1, 0, 1]]
>>> normalize(X, norm="l1")  # L1 normalization each row independently
array([[-0.4,  0.2,  0.4],
       [-0.5,  0. ,  0.5]])
>>> normalize(X, norm="l2")  # L2 normalization each row independently
array([[-0.67, 0.33, 0.67],
       [-0.71, 0.  , 0.71]])

normalize#

本页