binarize#
- sklearn.preprocessing.binarize(X, *, threshold=0.0, copy=True)[源代码]#
数组类或 scipy.sparse 矩阵的布尔阈值处理。
在 用户指南 中阅读更多内容。
- 参数:
- Xshape 为 (n_samples, n_features) 的 {array-like, sparse matrix}
要二值化的数据,逐个元素处理。scipy.sparse 矩阵应为 CSR 或 CSC 格式,以避免不必要的复制。
- thresholdfloat, default=0.0
小于或等于此阈值的功能值将被替换为 0,大于此阈值的功能值将被替换为 1。对于稀疏矩阵上的操作,阈值不得小于 0。
- copy布尔值, 默认为 True
如果为 False,则尝试避免复制并在原地进行二值化。这不保证总能在原地完成;例如,如果数据是具有对象 dtype 的 numpy 数组,即使 copy=False 也会返回副本。
- 返回:
- X_tr{ndarray, sparse matrix} of shape (n_samples, n_features)
转换后的数据。
示例
>>> from sklearn.preprocessing import binarize >>> X = [[0.4, 0.6, 0.5], [0.6, 0.1, 0.2]] >>> binarize(X, threshold=0.5) array([[0., 1., 0.], [1., 0., 0.]])