binarize#

sklearn.preprocessing.binarize(X, *, threshold=0.0, copy=True)[源代码]#

数组类或 scipy.sparse 矩阵的布尔阈值处理。

用户指南 中阅读更多内容。

参数:
Xshape 为 (n_samples, n_features) 的 {array-like, sparse matrix}

要二值化的数据,逐个元素处理。scipy.sparse 矩阵应为 CSR 或 CSC 格式,以避免不必要的复制。

thresholdfloat, default=0.0

小于或等于此阈值的功能值将被替换为 0,大于此阈值的功能值将被替换为 1。对于稀疏矩阵上的操作,阈值不得小于 0。

copy布尔值, 默认为 True

如果为 False,则尝试避免复制并在原地进行二值化。这不保证总能在原地完成;例如,如果数据是具有对象 dtype 的 numpy 数组,即使 copy=False 也会返回副本。

返回:
X_tr{ndarray, sparse matrix} of shape (n_samples, n_features)

转换后的数据。

另请参阅

Binarizer

使用 Transformer API 执行二值化(例如,作为预处理 Pipeline 的一部分)。

示例

>>> from sklearn.preprocessing import binarize
>>> X = [[0.4, 0.6, 0.5], [0.6, 0.1, 0.2]]
>>> binarize(X, threshold=0.5)
array([[0., 1., 0.],
       [1., 0., 0.]])